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PHYTASES DE PLANTES ET APPLICATIONS BIOTECHNOLOGIQUES 

La presente invention concerne les phytases de plantes, ainsi que leurs 
applications biotechnologiques. 

La presente invention concerne egalement un ou plusieurs fragment(s) 
d'acide nucleique codant pour une phytase de cereales, plus particulierement pour la 
phytase du mai's et un ou plusieurs fragment(s) caracterise(s) en ce qu'il s'agit de 
fragments d'ADNc ou d'ADN genomique. 

En outre, la presente invention concerne un fragment d'acide nucleique 
caracterise en ce qu'il comprend tout ou partie de la sequence de nucleotides telle que 
montree dans l'identificateur de sequences (SEQ ED) n° 1 codant pour une activite 
phytase ou tout ou partie des sequences genomiques Phyt I ou Phyt II telles que 
definies ci-apres. 

Enfin, la presente invention concerne un fragment caracterise en ce qu'il 
comprend tout ou partie de la sequence codante allant du nucleotide n° 32 a 1 192 de 
SEQ ID n° 1. 

La plus grande partie du phosphate present dans les plantes, notamment 
dans les semences, est sous la forme de phytine, sel complexe de myo-inositol-acide 
hexaphosphorique (acide phytique). La phytine constitue une reserve de phosphore, 
d'hydrates de carbone et de divers cations. Ainsi dans les grains de mai's, le phosphore 
du phytate represente jusqu'a 88 % du phosphore total (O'Dell et al., 1972). La 
mobilisation de la phytine est due aux phytases, type special de phosphatases, 
capables d'hydrolyser le phosphate a partir de l'acide phytique ainsi qu'a partir d'autres 
substrats phosphoryles (Gibson et Ullah, 1990). On a signale des activates de phytase 
dans une large gamme de semences. Generalement, on peut detecter de tres faibles 
quantites d'activite endogene dans les semences non germees, sauf pour le ble, le 
seigle et leur hybride triticale (Pointillard, 1994). Une forte augmentation d'activite 
concomitante avec une diminution de la phytine apparait au debut de la germination. 
On ne dispose que de peu d'informations sur les mecanismes qui regulent le niveau 
d'activite de la phytase dans les semences. 

L'interet qui existe pour la phytase vient de Tindustrie alimentaire. La 
phytine, ou acide phytique, provenant des farines de semences seches, n'est pas 
digeree par les animaux monogastriques en Tabsence de phytase exogene et est done 
excretee telle quelle, contribuant ainsi a la pollution par le phosphate des zones 
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d'elevages intensifs. De plus, elle est consideree comme un facteur antinutritionnel 
car elle chelate les mineraux essentiels tels que Ca, Fe et Zn lesquels, de ce fait, ne 
sont pas absorbes par les animaux monograstriques (Graf, 1986). Des recherches 
poussees ont ete entreprises afin de permettre la digestion du phytate par addition de 
phytases exogenes a de telles farines, Les phytases vegetales sont normalement 
produites en quantites insuffisantes pour leur utilisation dans les processus industries. 
On peut obtenir les phytases extracellulaires produites par le champignon Aspergillus 
niger en grandes quantites et on a trouve qu'elles conviennent bien pour une 
utilisation en tant qu'additif alimentaire pour les animaux (Nair et Duvnjak, 1990 ; 
Simons et al., 1990). On a sequence (van Hartingsveldt et al., 1993 ; Ehrlich et al., 
1993) des ADNc codant pour deux phytases differentes, Phy A et Phy B & Aspergillus 
niger. Recemment, on a obtenu des plants de tabac transgeniques exprimant de fa?on 
ectopique la phytase fongique Phy A (Pen et al., 1993 ; Verwoerd et al., 1995). 

Avant la presente invention, on n'avait pas pu obtenir d'ADNc codant 
pour une phytase vegetale et les mecanismes moleculaires qui commandent la 
regulation de P expression de la phytase au cours de la formation des semences ou de 
la germination n'etaient pas connus. Etant donne Pimportance de Pacide phytique 
comme forme de stockage du phosphate dans les grains de mai's, le clonage d'un gene 
de phytase vegetal et une meilleure connaissance de ces mecanismes etaient done tres 
recherches. 

Au cours de la germination, les plants de semis de mai's expriment une 
phytase capable d'hydrolyser la grande quantite de phytine emmagasinee dans le grain 
sec. Des etudes anterieures ont permis de purifier et de caracteriser cette enzyme 
(Laboure et al., Biochem. J, 1993, 295, 413 - 419). 

Dans ce travail anterieur (Laboure et al., 1993), on a decrit la 
caracterisation d'une phytase qui s'accumule dans les jeunes plants de mai's au cours 
des premiers jours de la germination. La proteine native apparait sous la forme d'un 
homodimere constitue de deux sous-unites a 38kDa. Cette enzyme presente la plupart 
des caracteristiques enzymatiques d'autres phytases acides vegetales. 

Selon la presente invention on a isole et caracterise un ADNc codant pour 
la sous-unite de cette phytase de semence de mais. Ceci constitue la premiere 
sequence nucleotidique obtenue pour une phytase vegetale. 

Selon la presente invention, on a utilise un polyserum de lapin dirige 
contre la phytase de mai's purifiee jusqu'a homogeneisation pour cribler une 
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5 bibliotheque ^expression d'ADNc de jeunes plants de mai's. On a pu isoler plusieurs 

clones positifs contenant un insert d'environ 1400 pb. On a etabli la sequence 
nucleotidique de V insert d'un de ces clones. Cet ADNc, appele phy SI 1, contient 
1335 pb avec un cadre ouvert de lecture pour 387 aa. On a etabli les residus N- 
terminaux (23 aa) de la phytase purifiee. On trouve ces residus dans les positions 19 - 

10 41 de la sequence d'aa pour laquelle code phy SI 1 . Ceci confirme que cet ADNc code 

pour la phytase du mais. 

La presente invention fournit done la premiere sequence codant pour une 
phytase vegetale. Ehrlich et Montalban (1992) et Gellatly et Lefebvre (1990) ont 
mentionne des essais de clonage et sequen^age d'ADNc de phytase respectivement 

15 provenant de semences de soja et de tubercules de pommes de terre, mais les 

sequences correspondantes n'ont jamais ete publiees, de sorte que la comparison de 
T ADNc du mais avec d'autres ADNc de phytase vegetale n'est pas possible. 

Les seules sequences nucleotidiques disponibles correspondent aux 
phytases provenant d' Aspergillus niger (van Hartingsveldt et al., 1993 ; Ehrlich et al., 

20 1993). Les phytases* de microorganismes appartiennent aux phytases de classe 3 qui 

commencent par retirer I'orthophosphate de la position 3 de Pacide phytique, tandis 
que les phytases vegetales appartiennent aux phytases de classe 6 qui catalysent 
T enlevement de Torthophosphate de la position 6. Des comparaisons anterieures entre 
les phytases purifiees & Aspergillus ficuum et de soja dues a Gibson et Ullah (1990) 

25 montrent que peu de caracteristiques physiques au niveau proteique (taille 

moleculaire, composition en acides amines, sequences d'aa partielles) semblent etre 
communes aux deux enzymes. En accord avec ces comptes-rendus anterieurs, la 
comparaison entre la sequence d'aa totale pour laquelle code l'ADNc phy SI 1 et celle 
de phy A & Aspergillus niger ne montre pas beaucoup de similitudes significatives. 

30 On trouve un recouvrement de 33 aa avec une homologie de 84 %, Cette region a 33 

aa des deux phytases d 1 Aspergillus Phy A et Phy B contient le motif consensus 
RHGxRxP trouve dans plusieurs phosphatases acides et dont on pense qu'il s'agit de 
la region accepteur de phosphate (Piddington et al., 1993). Les deux Arg et les residus 
His du consensus sont conserves dans la sequence du mais. Une mutagenese dirigee 

35 sur la phosphatase acide periplasmique de Exoli (EcAP) a montre que le 

remplacement de ces residus Arg et His dans le motif conserve aboutit a une forte 
reduction de I'activite enzymatique (Ostanin et al., 1992). Par consequent, la presence 
de ces residus dans la sequence de la phytase du mais peut etre en relation avec 
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5 l'activite de phosphatase. On remarque que le motif consensus est generalement 

localise a Textremite N-terminale des phosphatases acides de microorganisme 
(position 81-87 dans Phy A & Aspergillus), tandis qu'il est situe entre les positions 
204 et 210 dans la sequence du mais. Ces comparisons confirment que les phytases 
vegetales sont tres differentes des phytases A' Aspergillus bien caracterisees. 
10 En outre : 

a) les deux phytases 6* Aspergillus sont excretees dans Ie milieu 
exterieur lors d'une carence en phosphate. Elles possedent un peptide signal et sont 
fortement glycosylees. Or, les phytases de plantes sont destinees a hydrolyser la phytine 
contenue dans la plante. L'analyse de la sequence de la phytase de mais ne revele pas de 

15 peptide signal evident. Aucun residu glycosyle n'a ete detecte par reaction avec le reactif 
de Schiff ni avec la phytase de mais, ni avec la phytase de soja purifiee anterieurement 
par Gibson et Ullah (1990). Aucun motif consensus d'attachement de residu glycosyle 
n'est observe sur la sequence proteique de la phytase de mais ; 

b) le profil d'hydropathie de Phy Sll revele la presence dans la 
20 region COOH-terminate d'une sequence de 65 aa fortement hydrophobe. Cette sequence 

peut servir d'ancrage de Penzyme aux corps proteiques, organites pourvus d'une 
membrane et dans lesquels la phytine est localisee sous forme de globoides. Des 
experiences deja anciennes, realisees sur le pollen (Baldi et al., 1988, Plant Science, 56, 
137-147), ont montre que les phytases acides etaient attachees a la membrane des corps 
25 proteiques dont elles constituent "un composant externe". 

L'analyse de la sequence proteique de Phy S 1 1 indique done que cette 
phytase de plante est tres differente des phytases de champignons seules caracterisees 
jusqu'ici, et vraisemblablement mieux adaptee a digerer le phytate endogene des 
graines. 

30 La presente invention a done pour objet les fragments d'acide nucleique 

isole codant pour une enzyme phytase de plante. 

Plus particulierement, T enzyme est la phytase de cereale, telle que, mais, 
ble, orge, seigle, triticale. 

Dans un mode de realisation prefere, la presente invention a pour objet un 
35 fragment d'acide nucleique isole codant pour une activite phytase, caracterise en ce 

qu'il comprend tout ou partie d'une sequence de nucleotides telle que montree dans 
Tidentificateur de sequence n° 1, ou tout ou partie d'une sequence homologue a celle 
montree dans Tidentificateur de sequence n° 1, ou tout ou partie d'une sequence 
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complementaire de ladite sequence de l'identificateur de sequence n° 1 ou d'une 
sequence homologue. 

Par "fragment d'acide nucleique", on entend ici une sequence 
nucleotidique pouvant etre de type ADN ou ARN. Ces termes sont definis dans tous 
les ouvrages de base de biologie moleculaire. Preferentiellement, un fragment d'acide 
nucleique selon Y invention est un fragment d'ADN double brin. 

Le terme "partie" designe notamment un fragment d'au moins 20 
nucleotides, en particulier d'au moins 100 nucleotides, par exemple d'au moins 500 
nucleotides et avantageusement d'au moins 1000 nucleotides identiques a une portion 
d'une longueur equivalente de la sequence nucleotidique concernee. 

Le terme "homologue" fait reference a tout acide nucleique presentant une 
ou plusieurs modification(s) de sequence par rapport a tout ou partie de la sequence 
montree dans SEQ ID n°l, et codant pour un enzyme ayant l'activite mentionnee ci- 
dessus. 

Ces modifications peuvent etre obtenues par mutation, deletion et/ou 
addition d'un ou plusieurs nucleotide(s) par rapport a la sequence native. Elles 
peuvent etre introduces notamment pour ameliorer l'activite de I'enzyme. Dans ce 
contexte, on preferera un degre d'homologie d'au moins 70 % par rapport a la 
sequence native, avantageusement d'au moins 80 %, de preference d'au moins 90 % 
et plus preferentiellement encore d'au moins 95 %. Par exemple, l'invention concerne 
deux phytases aux sequences d'acides amines differentes, notamment dans la partie 
N-terminale. L'homme du metier connait les techniques permettant d'evaluer si 
l'homologue genere presente une activite modifiee par production de l'enzyme 
mutagenisee dans un hote heterologue. 

La sequence de SEQ ED n° 1 est une sequence d'ADNc, c'est-a-dire 
depourvue des introns de la phytase de mais. 

L'invention a notamment pour objet une sequence d'ADN identique ou 
homologue a plus de 70 % de tout ou partie de la sequence telle que definie dans SEQ 
ID N° 1. 

De preference, le fragment selon l'invention comprend la sequence 
complete de 1335 nucleotides telle que montree sur SEQ ID n° 1, une sequence 
homologue, une sequence complementaire, ou une sequence homologue a ladite 
sequence complementaire. Le fragment comporte en particulier la sequence leader 
allant du nucleotide n° 1 a 31 de SEQ ID n° 1, ainsi que la sequence de terminaison 
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5 allant du nucleotide 1 193 a 1335 de SEQ ED n° 1. En outre, de fa?on classique, il peut 

comporter ladite sequence de terminaison augmentee d'une queue poly A a son 
extremite 3\ 

Selon une variante encore preferee, le fragment selon P invention 
comprend tout ou partie de la sequence codante allant du nucleotide n° 32 a 1192 de 
10 SEQ ID n° 1, ou son complementaire, ou d'une sequence homologue ou 

complementaire de ladite sequence homologue. 

L' invention inclut egalement toute sequence capable de s'hybrider dans 
des conditions stringentes avec Pune des susdites sequences. A partir d'un fragment 
originaire d'une plante particuliere, on peut ainsi isoler des fragments homologues 
15 d'autres plantes. D'autre part, a Paide de PADNc, on a isole les ADN genomiques 

correspondants. 

La presente invention a done egalement pour objet PADN genomique 
codant pour la phytase de la plante. 

La presente invention a egalement pour objet un fragment constitue par de 
20 PADNc et comportant en outre une partie seulement des fragments introniques de 

PADN genomique. Les introns permettent dans certains cas d'ameliorer la structure 
conformationnelle de P ARN messager et ses taux d' expression. 

II doit etre bien entendu que Pinvention a egalement pour objet toute 
sequence d'ADN equivalente, e'est-a-dire qui differe des sequences mentionnees ci- 
25 dessus seulement par une ou plusieurs mutations neutres, e'est-a-dire dont le 

changement ou la substitution de nucleotides en cause n'affecte pas la sequence 
primaire de la proteine resultante. 

De preference, le fragment d'ADN selon Pinvention sera associe a une 
sequence regulatrice appropriee pour sa transcription, sa traduction et son adressage, 
30 tels que des promoteurs et ses eventuels enhancers, et des terminateurs, y compris des 

codons start et stop. Les moyens et methodes pour identifier et selectionner ces 
differents signaux de regulation sont bien connus de Phomme du metier. 

La presente invention a egalement pour objet une sequence d'ADN 
identique ou homologue a plus de 70 % de tout ou partie de la sequence telle que 
35 definie dans SEQ ID N° 2 ou SEQ ID N° 3. SEQ ID N° 2 represente la sequence 

nucleotidique correspondant au gene PHYT I (egalement representee sur la figure 4); 
SEQ ID N° 3 represente la sequence nucleotidique correspondant au gene PHYT II 
(egalement representee sur la figure 5). 
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5 Dans un mode de realisation, le fragment selon F invention comporte le 

promoteur de FADN genomique de la plante. 

L'invention a egalement pour objet une sequence d'ADN caracterisee en 
ce qu'elle comprend tout ou partie d'une sequence complementaire ou 
complementaire de Fhomologue d'une sequence telle que definie dans SEQ ID N° 1, 

10 SEQ ID N° 2 ou SEQ ID N° 3. Elle a egalement pour objet Futilisation d'une de ces 

sequences comme sonde moleculaire. 

La presente invention a done egalement pour objet le promoteur d'un gene 
de phytase de plante ainsi que le promoteur d'un gene de phytase de cereale et le 
promoteur d'un gene de phytase de mai's. Avantageusement, le promoteur d'un gene 

15 de phytase de plante contient tout ou partie du fragment allant du nucleotide n° 1 au 

nucleotide n° 2096 de la sequence telle que definie par SEQ ID N° 2, ou tout ou partie 
du fragment allant du nucleotide n° 1 au nucleotide n° 1328 de la sequence definie par 
SEQ ID N° 3. 

Entrent egalement dans le champ de la presente invention, les promoteurs 
20 d'un gene de phytase de plante comprenant une sequence identique ou homologue a 

plus de 70 % de la sequence des fragments telle que ci-dessus definie ainsi que les 
promoteurs comprenant tout ou partie d'une sequence complementaire ou 
complementaire de Fhomologue d'une telle sequence. 

L* invention comprend egalement Futilisation des susdits promoteurs dans 
25 des constructions moleculaires destinees a ameliorer la qualite agronomique 

alimentaire ou industrielle d'une plante notamment la resistance aux pathogenes ou la 
disponibilite en nutriments. 

La presente invention a aussi pour objet une cassette d'expression 
caracterisee en ce qu'elle comporte un fragment d'acide nucleique selon la presente 
30 invention, place sous le controle de sequences regulatrices capables de commander 

F expression de ladite phytase. Avantageusement, ces sequences regulatrices 
comprennent un promoteur tel que defini plus haut. 

Dans une variante de realisation lesdites sequences regulatrices sont 
capables de commander Fexpression specifiquement dans un type particulier de tissu, 
35 notamment dans Falbumen. 

Comme exemple de signaux d'adressage chloroplastiques, on peut citer la 
sequence codant pour le peptide transit du precurseur de la petite sous-unite de la 
ribulose 1,5-biphosphate carboxylase de Piswn sativum. Comme signaux d'adressage 
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mitochondrial, on peut citer la sequence codant pour le peptide transit du precurseur 
de la sous-unite beta de PATP-aseFl mitochondriale de Nicotiana plumbaginifolia. 

Ces peptides transits, ainsi que la methionine N-terminale, sont 
normalement clives dans les chloroplastes ou les mitochondries. L'expression des 
proteines dans les plastes a done egalement l'avantage de produire une molecule 
depourvue de la methionine N-terminale comme la molecule naturelle. 

Selon une autre variante, les sequences d'adressage peuvent etre des 
sequences codant pour un peptide signal N-terminal ("prepeptide"), eventuellement en 
association a un signal responsable de la retention de la proteine dans le reticulum 
endoplasmique (signal du type KDEL), ou un signal d'adressage vacuolaire ou 
"propeptide". La presence du peptide signal N-terminal ou prepeptide permet la 
penetration de la proteine naissante dans le reticulum endoplasmique ou ont lieu un 
certain nombre de maturations post-traductionnelles, notamment le clivage du peptide 
signal, les N-glycosylations, si la proteine en question presente des sites de N- 
glycosylation, et la formation des ponts disulfides. Parmi ces differents signaux, le 
prepeptide, responsable de Padressage de la proteine dans le reticulum 
endoplasmique, est tres utile. II s'agit normalement d'un peptide signal N-terminal 
hydrophobe ayant entre 10 et 40 acides amines et etant d'origine animale ou vegetale. 
De preference, il s'agit d'un prepeptide d'origine vegetale, par exemple celui de la 
sporamine, de la tectine d'orge, de Pextensine vegetale, de Tot-mating factor, de la 
proteine de pathogenese 1 ou 2. 

Normalement, le peptide signal est clive par une signal peptidase des 
P introduction co-traductionnelle du polypeptide naissant dans la lumiere du RER 
(Reticulum Endoplasmique Granuieux). La proteine mature ne comporte plus cette 
extension N-terminale. 

Pour obtenir la secretion, on peut par exemple utiliser le peptide signal de 
la sporamine A des racines tuberisees de la patate douce. 

Les sequences d'adressage peuvent, outre le prepeptide, aussi comporter 
un signal de retention endoplasmique, consistant en les peptides KDEL, SEKDEL ou 
HEKDEL. Ces signaux se trouvent normalement a Pextremite C-terminale de la 
proteine et subsistent sur la proteine mature. La presence de ce signal a tendance a 
augmenter les rendements en proteines recombinantes. 

Les signaux d'adressage peuvent, outre le prepeptide, comporter aussi un 
signal d'adressage vacuolaire ou "propeptide". En presence d'un tel signal, apres 
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5 passage dans le RER, la proteine est adressee aux vacuoles des tissus aqueux, par 

exemple les feuilles, ainsi qu'aux corps proteiques des tissus de reserve, par exemple 
les graines, tubercules et racines. L'adressage de la proteine vers les corps proteiques 
de la graine est particulierement interessant en raison de la capacite de la graine a 
accumuler des proteines, jusqu'a 40 % des proteines par rapport a la matiere seche, 

10 dans des organites cellulaires derives des vacuoles, appeles corps proteiques et en 

raison de la possibility de stocker plusieurs annees les graines contenant les proteines 
recombinantes a Petat deshydrate. 

Comme propeptide, on peut utiliser un signal d'origine animale ou 
vegetale, les signaux vegetaux etant particulierement preferes, par exemple la pro- 

15 sporamine. Le propeptide peut etre N-terminal ("N-terminal targeting peptide" ou 

NTTP), ou C-terminal (CTTP). Dans la mesure ou les propeptides sont normalement 
dives des F entree de la proteine dans la vacuole, ils ne sont pas presents dans la 
proteine mature. 

L'utilisation du peptide signal ou propeptide, peut conduire a la 
20 glycosylation de la proteine. 

En F absence de tout signal d'adressage, la proteine est exprimee dans le 
cytoplasme. 

De preference, F accumulation de la phytase est realisee dans Falbumen. 
Comme vecteur de clonage ou d'expression comprenant le fragment, on 
25 peut citer les vecteurs comprenant une sequence d'ADN contenant au moins une 

origine de replication telle que des plasmides, des cosmides, des bacteriophages, des 
virus etc. On utilisera en particulier, des plasmides. 

La presente invention a done aussi pour objet un precede pour accroitre la 
teneur en phytase dans une plante, caracterise en ce qu'on induit une surexpression de 
30 F enzyme phytase dans la plante a Faide d'une cassette depression selon la presente 

invention. En d'autres termes, on induit une surexpression de Factivite phytase dans la 
plante. 

On entend ici par "phytase" une definition fonctionnelle qui inclut toute 
phytase de plante capable de fonctionner comme un marqueur de selection en 
35 conferant Factivite phytase a une cellule hote deficiente en phytase ou possedant une 

activite enzymatique telle que mesuree par exemple selon Fexemple 1.13. Cette 
definition inclut aussi toute phytase de plante capable de fonctionner dans une plante 
donnee pour accroitre Factivite phytase de ladite plante. Ce terme inclut done non 
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5 seulement l'enzyme specifique de la plante specifique a traiter, mais tout autre 

enzyme phytase d'autres plantes si cette phytase est capable de fonctionner dans les 
plantes a traiter. 

On entend ici par "surexpression" aussi bien une augmentation du taux 

d'activite de phytase par rapport au taux exprime dans une plante normale, qu'une 
10 deregulation de Pexpression conduisant a F expression de Factivite phytase dans un 

tissu ou un compartiment et/ou a un stade de developpement ou celle-ci n'est 

normalement pas exprimee. 

L'obtention de plantes exprimant de fafon deregulee la phytase, est 

obtenue en introduisant par les methodes du genie genetique, un gene de phytase de 
15 plante eventuellement modifie de fa9on appropriee a obtenir la modification de 

F expression, et de preference la surexpression de la phytase dans la plante a 

ameliorer. 

Ces plantes pourront etre modifiees par les methodes du genie genetique 
decrites dans la litterature, par transformation de cellules suivie de leur regeneration, 
20 ou par transformation de tissus ou de gametes. 

Dans un mode prefere de realisation du procede de F invention, on 
introduit dans le genome de la plante une sequence codante fonctionnelle dans des 
conditions permettant son expression. 

On entend par "sequence codante fonctionnelle" une sequence d'ADN 
25 codant pour un polypeptide tel que defini ci-dessus comme "phytase", ladite sequence 

peut done etre plus courte ou plus longue que la sequence codante totale du gene 
complet de Fenzyme. En particulier, la "sequence codante fonctionnelle" inclura la 
sequence codante pour un peptide signal en 5' et/ou en 3\ 

Le gene etranger peut etre un gene heterologue, e'est-a-dire qui provient 
30 d'une plante differente que la cellule hote, le gene codant pour un polypeptide 

ordinairement non produit par la plante dans le genome de laquelle il est introduit. 

Le gene etranger introduit dans le genome de la plante peut aussi etre un 
gene homologue au gene endogene, e'est-a-dire dont F expression produit la phytase 
naturellement produite par la plante. 
35 Par "conditions permettant son expression", on entend que le gene codant 

la phytase est place sous le controle d'elements assurant son expression. 

En particulier, la sequence d'ADN codant pour la phytase est associee a 
une sequence regulatrice appropriee pour sa transcription, sa traduction et son 
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5 adressage, tels que des promoteurs et ses eventuels enhancers, et des terminateurs, y 

compris des codons start et stop. Les moyens et methodes pour identifier et 
selectionner ces differents signaux de regulation sont bien connus de Phomme du 
metier. 

Ledit gene fonctionnel codant pour la phytase peut etre introduit dans des 

10 cellules de plantes selon des techniques connues. On pourra utiliser par exemple dans 

ce cas, mais non obligatoirement, le systeme de regulation du gene de la phytase. 

On peut citer, tout d'abord, les methodes de transfert direct de genes telles 
que la micro-injection directe dans des cellules d'embryon de la plante (Neuhaus et 
Coll., 1987) ou Pelectroporation (Chupeau et Coll., 1988) ou encore la precipitation 

15 direct e au moyen de PEG (Schocher et Coll., 1986) ou le bombardement par canon de 

particules (Mc Cabe et Coll., 1988). 

On peut aussi infecter la plante par une souche bacterienne notamment 
d* Agrobacterium tumefaciens selon une methode eprouvee (Schell et Van Montagu, 
1983) ou d y Agrobacterium rhizogenes notamment pour les especes recalcitrantes a la 

20 transformation (Chilton et Coll., 1982). La souche bacterienne comportera le gene 

codant pour la phytase sous le controle d'elements assurant Pexpression dudit gene. 
La souche pourra etre transformee par un vecteur dans lequel est insere le gene codant 
la phytase sous le controle d'elements assurant Pexpression dudit gene. Ce gene sera 
insere par exemple dans un vecteur binaire tel que pBIN19 (Bevan, 1984) ou pMON 

25 505 (Horsch et Klee, 1986) ou tout autre vecteur binaire derive des plasmides Ti et Ri. 

II pourra aussi etre utilement introduit par recombinaison homologue dans un 
plasmide Ti ou Ri desarme, tel que pGV 3850 (Zambryski et Coll., 1983) avant la 
transformation de la plante. 

II a ete montre recemment que des plantes monocotyledones telles que le 

30 riz et le mais pouvaient etre avantageusement transformees par Agrobacterium 

tumefaciens, riz : Hiei et al. 1994, The Plant Journal 6 : 271-282; mais : Ishida et al. 
1996, Nature biotechnology 14 : 745-750). 

Par exemple, on transformer les especes monocotyledones, notamment le 
riz, le ble et le mais, en utilisant Agrobacterium tumefaciens. 

35 A titre de vecteur d'expression comprenant le gene fonctionnel de la 

phytase selon P invention, on peut citer les vecteurs comprenant une sequence d'ADN 
contenant au moins une origine de replication telle que des plasmides, des cosmides, 
des bacteriophages, des virus, etc. On utilisera en particulier des plasmides. 
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Lorsque Ton introduit un gene fonctionnel codant pour une phytase selon 
P invention dans le genome de la plante, ce sera de preference sous le controle d'un 
promoteur heterologue. 

Enfin, la presente invention a egalement pour objet des plantes ou organes 
vegetaux a teneur en phytase accrue pouvant etre obtenus par le procede selon 
Tinvention. 

La teneur en phytase peut etre accrue globalement ou seulement 
localement, c'est-a-dire dans une partie de la plante ou un compartiment cellulaire 
particulier. 

On cite comme plantes transgeniques selon Tinvention les cereal es, 
notamment le mais, le ble, Torge, le sorgho, le seigle ainsi que le pois, le soja et la 
pomme de terre. 

La presente invention a plus particulierement pour objet une plante, 
notamment transgenique, selon Tinvention, caracterisee en ce qu'elle produit des 
semences transgeniques exprimant une quantite accrue de phytase. 

La presente invention a egalement pour objet des semences sechees de 
plantes transgeniques selon Tinvention et notamment des semences comportant une 
teneur en phytase accrue obtenue par expression specifique du fragment d'acide 
nucleique ou de la sequence d'ADN selon la presente invention, dans la semence. 

La presente invention a en effet egalement pour objet un hote vegetal 
consistant en une plante ou organe vegetal notamment transgenique dans lequel la 
phytase de plante peut etre exprimee dans une partie de la plante ou un compartiment 
cellulaire ou cette enzyme n'est pas produite naturellement, caracterise en ce qu'on a 
introduit une cassette d'expression selon Tinvention comportant des sequences 
regulatrices qui induisent une expression specifique dans ladite partie de la plante ou 
ledit compartiment cellulaire. La plante ou Torgane vegetal en question est 
avantageusement une cereale et plus avantageusement encore du mais ou leurs 
organes correspondants. 

La presente invention a egalement pour objet une farine obtenue a partir 
d'une semence selon Tinvention. 

Enfin, la presente invention a pour objet une composition pour 
T alimentation humaine ou animale comprenant des semences, une farine de semences 
ou une phytase selon la presente invention. 
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5 De plus, la plante ou une partie de celle-ci peut etre utilisee dans la ration 

alimentaire d'animaux monogastriques, d'une part pour reduire le taux de phytate 
dans le filmier ou lisier et d'autre part pour ameliorer la digestibilite du phytate. Par 
exemple, la phytase exprimee agira sur la plante au cours de son developpement. La 
phytase sera egalement utilisee dans les procedes de preparation alimentaire ou dans 

10 les procedes d'extraction de l'amidon (precede de trempage). L'activite phytasique 

generee est egalement utilisable pour valoriser les eaux de trempage recuperees ou les 
eaux de brassage. En particulier, la disponibilite accrue du phosphore rend ces eaux 
tres utiles comme additifs pour milieux de culture ou supports de fermentation. En 
outre, Tactivite phytasique generee permet une meilleure recuperation de Tinnositol et 

15 de ses derives a partir des eaux de trempage ou de brassage. 

L' invention concerne egalement Putilisation de la phytase selon 
Tinvention pour obtenir une meilleure disponibilite du calcium, par exemple a des fins 
alimentaires. 

Si on utilise la phytase recombinante et non la plante elle-meme, Tactivite 
20 de la phytase s'exerce sur des phytates d'une autre origine vegetale presentes dans la 

ration. 

Les fragments d'ADN selon Tinvention peuvent aussi etre utilises pour 
transformer des microorganismes ou des cellules eucaryotes pour doner et produire 
Tenzyme phytase. 

25 La presente invention a done egalement pour objet une methode de 

production de phytase, caracterisee en ce qu'elle comprend les etapes de : 

a) transformation d'un hote eucaryote ou procaryote, en paiticulier 
d'un vegetal ou d'un microorganisme avec une cassette d'expression selon la presente 
invention, comportant des sequences regulatrices capables de commander 

30 ['expression d'une quantite accrue de phytase dans l'hote vegetal ou le 

microorganisme respectivement ; 

b) culture du microorganisme transforme ou croissance de la plante 
transformee, et 

c) extraction de la phytase de la culture de microorganismes ou des 
35 tissus vegetaux transgeniques. 

La presente invention a egalement pour objet une phytase recombinante 
obtenue par le procede selon Tinvention, preferentiellement sous forme d'un dimere 
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5 ou d'un heterodimere, et des anticorps diriges contre la phytase de la plante selon 

T invention. 

La presente invention a egalement pour objet l'utilisation de la phytase 
pour augmenter Pextractabilite des amidons des grains ou elle s'exprime. Le phytate 
fait precipiter les proteines avec Pamidon de sorte que si Ton reduit le taux de phytate, 
10 P extraction de Pamidon s'en trouve facilitee. L'ajout d'une phytase aux grains de 

plantes a partir desquels on souhaite extraire Pamidon permet de pallier la 
precipitation des proteines par les phytates. 

Plus precisement, la presente invention a done pour objet Putilisation 
d'une phytase selon Pinvention et/ou de semences contenant une phytase selon 
15 Pinvention pour extraire Pamidon a partir de grains de plantes. 

Enfin, on peut utiliser les fragments d'ADN selon Pinvention comme 
marqueur d'un phenotype lie a P expression de la phytase. 

L'invention concerne egalement Putilisation d'une phytase selon 
Pinvention ou Putilisation de tout ou partie de plantes contenant une phytase selon 
20 Pinvention, pour la production de myo-inositol a des fins therapeutiques ou 

dietetiques. 

Le myo-inositol, forme nutritionnelle active de Pinositol, est un 
constituant du phospholipide phosphatidylinositol. 

Le myo-inositol est connu pour ses vertus dans le domaine de la sante. On 
25 lui a souvent attribue des effets sur la diminution de la concentration des triglycerides 

et du cholesterol dans le sang, et plus generalement pour la protection contre les 
maladies cardiovasculaires. 

II est reconnu que les composes issus d'un phospholipide tel que le myo- 
inositol ont des effets benefiques sur Pinsomnie et Panxiete. 
30 Par ailleurs, la nevropathie peripherique du diabetique est une des 

complications les plus paralysantes du diabete. Or, on suppose depuis deja plusieurs 
annees qu'une diminution du taux de myo-inositol est associee aux degats des fibres 
nerveuses des diabetiques souffrant d'une telle complication. 

Aux Etats-Unis, les personnes adultes consomment environ 1 gramme/jour 
35 de myo-inositol le plus souvent sous forme de phospholipide ou d'acide phytique 

d : origine vegetale. 



WO 98/05785 



PCT/FR97/01443 



15 

5 D'autres caracteristiques et avantages de la presente invention apparaitront 

a la lumiere de la description detaillee qui va suivre faite en reference aux Figures 1 a 
6. 

La Figure 1 represente la sequence nucleotidique et la sequence d'acides 
amines deduite de PADNc phy Sll. 

10 Les acides amines soulignes correspondent a deux sequences N- 

terminales obtenues a partir de la phytase de mais purifiee. La sequence d'aa qui 
presente une homologie avec 33 aa de la phytase d 1 Aspergillus Phy A (van 
Hartingsveldt et al., 1993) est soulignee en pointille. Les sites Ncol (CCATGG) et 
Asel (ATTAAT) utilises pour le clonage dans le vecteur d'expression pET 14 (b) sont 

15 encadres. 

La Figure 2 represente la comparaison des regions de recouvrement de 33 
aa de la sequence proteique deduite de TADNc phy SI 1 et des sequences de phytases 
Phy A et Phy B A' Aspergillus. 

Les ombres foncees indiquent les acides amines conserves et les acides 
20 amines similaires quant. a eux sont encadres et apparaissent en caractere gras. La 

sequence consensus RHGxRxP dont on suppose qu'etle correspond au motif 
accepteur de phosphate est soulignee. On precede a la comparaison en utilisant le 
programme FastA de GCG. 

La Figure 3 represente les cartes de restriction deduites des clones 
25 genomiques isoles de la banque EMBL3. 

Lesende : EI : EcoRI ; HIII : Hind III ; SI : Sal I 
sequence genomique adjacente 
j^t] region chimerique 

La Figure 4 represente la sequence nucleotidique du clone de classe I 
30 (P19.14 fragment Hindlll / Sal I de 4,7 Kb) codant pour une proteine phytase de 

classe I correspondant au gene PHYT I (cette sequence correspond a SEQ ID N° 2). 

Legende : les lettres minuscules correspondent a la sequence non codante, 
les lettres majuscules correspondent a la sequence transcrite, la sequence proteique 
deduite est indiquee en utilisant le code a trois lettres de la representation des acides 
35 amines. 

La Figure 5 represente la sequence nucleotidique du clone de classe II 
(P23.7 fragment Hindlll de 3 Kb) codant pour une proteine phytase de classe II 
cotrespondant au gene PHYT II (cette sequence correspond a SEQ ID N° 3). 
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Legende : les lettres minuscules correspondent a la sequence non codante, 
les lettres majuscules correspondent a la sequence transcrite, la sequence proteique 
deduite est indiquee en utilisant le code a trois lettres de la representation des acides 
amines. 

(+1161): depart du produit Race n° 92 
(+1175): depart de TEST 
(+1314): depart du produit Race n° 93 
(+ 1351) : depart du produit Race n° 87 
(+ 1548) : depart du produit Race n° 54. 

La Figure 6 represente la comparaison de sequences proteiques des 
phytases de PADNc phy SI 1, de classe I et de classe II. L'alignement a ete realise 
avec le programme "Clustal V multiple alignement" La sequence proteique est 
indiquee en utilisant le code a une lettre de la representation des acides amines. 

I. MATEREELS ET PROCEDES 

LI) Conditions de germination des semences de mais 

On utilise successivement trois lignees homozygotes de Zea mays pour ce 
travail. On constniit la bibliotheque d'ADNc avec des ARN extraits a partir de Zea 
mays c.v. M017 (Maisadour). L'ARN utilise pour des analyses de Northern blot est 
extrait de Zea mays c.v. AM0406 (Maisadour). On imbibe des semences de mais 
pendant douze heures dans de l'eau distillee aeree a la temperature ambiante puis on 
les transfere dans du sable humide a 26°C, avec une photo-periode de huit heures (50 
jj£/s par m^). 

Des germinations de grains de mais de la lignee B73 sont realisees sur 
vermiculite a Pobscurite a 28°C. La lignee B73 a ete choisie pour l'analyse des 
departs de transcription car les sequences genomiques ont ete determinees a partir de 
ce materiel genetique. Ainsi, les differences eventuelles notees entre les sequences des 
transcrits et celles de fragments genomiques ne pourront pas etre attributes a du 
polymorphisme interparietal. 

L2) Construction et criblage d'une bibliotheque d'ADNc 
L2a) ADN complementaire 

On purifie TARN total a partir d'embryons congeles (scutellum et axe 
embryonnaire) de jeunes plants de mais ages de trois a quatre jours, en utilisant du 
chlorhydrate de guanidine (Logemann et al., 1987). On selectionne la fraction 
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poly(A)* sur des colonnes d'oligo dT (Pharmacia). On a synthetise I'ADNc a deux 
brins en utilisant un necessaire d'ADNc (Promega) et un adaptateur d'amorce d'oligo 
(dT)-Notl. Apres ligature des adaptateurs Eco RI (Pharmacia), on digere I'ADNc avec 
Notl et on le clone de fa?on directionnelle dans Xgtl 1 (Promega). On obtient environ 
1 x 10 6 recombinants independants apres encapsidation (Stratagene) et infection d\E. 
coli souche LE392 (Promega). On amplifie la bibliotheque d'ADNc de Xgtl 1 dans E. 
coli souche RY1090. On precede au criblage immunologique des plages du phage en 
utilisant le systeme d'immuno-criblage ProtoBlot de Promega selon le protocole du 
fournisseur. On effectue le criblage avec un antiserum brut de lapin dirige contre la 
phytase purifiee de mais (Laboure et al., 1993). Apres dilutions (1 : 1000 pour le 
premier criblage et 1 : 5000 pour les etapes de criblage suivantes), on traite 
T antiserum avec des extraits de £. coli comme il est indique dans les directives 
Promega. On isole plusieurs phages recombinants positifs apres criblage de 1,5 x 10 5 
plages. On soumet alors ces phages positifs a un second criblage avec un anticorps 
plus specifique purifie par affinite sur la sous-unite de phytase (Laboure et al., 1993). 
On estime la taille des inserts par reaction PCR avec des amorces U5 (5' 
A AC AGCT AT G ACC ATG-3 ' ) (SEQ ID N° 4) et U3 (5'- 
GT AAAACG AACGGCC AGT-3 ) (SEQ ID N° 5), en utilisant les conditions 
d'amplification decrites par Marin et al. (1996). On sous-clone alors les inserts des 
phages interessants dans les sites Eco RI - Notl d'un vecteur pBS-SK + (Stratagene). 
On determine les sequences nucleotidiques sur un ADN a deux brins en utilisant la 
trousse PRISM Ready Reaction Kit (Applied Biosystems), en suivant les instructions 
du fabricant et en utilisant un appareil a cycle thermique d' ADN Perking Elmer Cetus 
PEC480 et un sequenceur ABI 373A (Applied Biosystems). 

On procede a des hybridations de plages de phages avec l'ADNc de phy 
AM10 partiel comme sonde, afin d'isoler des ADNc de pleine longueur, sur 360 000 
plages selon la technique de Benton et Davis (Sambrook et al., 1989) : on plonge le 
filtre, cote ADN vers le haut, dans la solution denaturante pendant dix minutes, puis 
pendant six minutes dans la solution neutralisante. 

On effectue T analyse de la sequence totale de T insert a 1,4 kb de phy SI 1 
sur les deux brins par le procede de la terminaison de chaine didesoxy (Sanger et al., 
1977) en utilisant les matrices a un seul brin M13 mpl8 et mpl9 (la teneur elevee en 
GC dans cet insert ne permet pas son sequen?age sur V ADN a deux brins). 
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On procede a des analyses de sequence en utilisant la trousse UWGCG 
(University of Wisconsin Genetics Computer Group), manuel du programme de la 
trousse Wisconsin, version 8, septembre 1994, Genetics Computer Group, 575 
Science Drive, Madison, Wisconsin, USA 53711. 

Le programme Mac Vector (Kaufman et ai 1994, Eastman KODAK 
company New Haven, CT, USA) a aussi ete utilise pour les traitements des sequences 
genomiques. 

1.2 b) ADN genomique 

L'ADNc phytase phy SI 1 (fragment Eco RI / Not I contenant la sequence 
phy Sll de 1335 pb) est utilise comme sonde pour le criblage d'une banque 
genomique lambda de mafs. La banque est une banque commerciale (Clontech, Palo 
Alto, CA, USA) construite a partir de fragments d'ADN extraits de plantules de la 
lignee B73. L'ADN est digere partiellement par Tenzyme Mbo I. Les fragments 
genomiques ainsi obtenus, d'une taille de 8 a 22 Kb, sont clones au site Bam HI du 
phage EMBL-3 (Frischauf et ai 1983, J. Mol. Biol. 170 : 827) et peuvent etre excises 
par une digestion enzymatique Sal I. 

Le criblage de la banque genomique a ete realise suivant les indications de 
Sambrook et al (1989, Molecular cloning : a laboratory manual, Cold Spring Harbor 
Laboratory Press, New York). 10 6 phages recombinants par banque d'ADN 
genomique (soit six equivalents genome mais au total) sont etales a differentes 
concentrations sur des boites de petri en presence de la bacterie hote. Des replicats des 
plages de lyse sont realises sur filtre de nitrocellulose. Les phages recombinants 
contenant des fragments genomiques . homologues a TADNc phytase sont reperes 
apres hybridation des filtres avec la sonde phytase. Par superposition du filtre 
presentant des signaux positifs avec la boite correspondante, la plage de lyse 
interessante est prelevee et les phages remis en suspension. Les phages sont ensuite 
redilues, reetales sur boTte de petri pour subir un crible supplemental. Trois cribles 
successifs ont ete realises afin d'obtenir des clones positifs isoles. Apres le troisieme 
tour de criblage, treize clones etaient positifs. 

Apres purification de PADN des treize clones genomiques isoles 
(protocole Qiagen®, Chatsworth, CA, USA), ceux-ci sont caracterises par digestion 
enzymatique, hybridation et sequenfage selon la technique classique de Sanger et ai 
(1977) a Taide du kit commercial "fmol DNA Sequencing System" (Promega, 
Madison, WI, USA). 
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Les ADN des treize clones sont digeres par les enzymes de restriction Sal 
I, Hind III, Eco RI (simples digestions) et Sal I + Hind III (double digestion). Apres 
electrophorese sur gel d'agarose des differents fragments et transfer! sur membranes 
de nylon Hybond N+ (Amersham, Buckinghamshire, UK), ces dernieres sont 
hybridees avec la sonde d'ADNc phy SI 1 . 

Plusieurs fragments issus des clones phagiques ont ete sous-clones dans le 
plasmide pBS II SK + (Stratagene, La Jolla, CA, USA) selon les techniques classiques 
de clonage (Sambrook et al 1989, Molecular cloning : a laboratory manual, Cold 
Spring Harbor Laboratory Press, New York). Les fragments sous-clones presentes ci- 
dessous, contiennent une sequence homologue a TADNc phy SI 1. 
Classe I : P19.14 (fragment Sal I/Hind III de 4,7 Kb) 
Classe II : P13.2 (fragment Sal I de 5,5 Kb) 

P13.6 (fragment Hind III de 2,6 Kb) 

P13.13 (fragment Eco RI de 3,8 Kb) 

P23.7 (fragment Hind III de 3 Kb) 

Le sequenfage a ete initie aux extremites de ces inserts avec les amorces 
universelles Reverse et M13-20 (Biolabs, Beverly MA, USA) de "fa<?on manuelle" 
(utilisation du Kit "fmol DNA Sequencing System" de Promega). La strategic de 
progression par oligonucleotides a ete adoptee pour completer les donnees. Les 
sequences determines avec les oligonucleotides internes ont ete obtenues par 
sequen9age automatique aupres d'une societe de service (Genome Express, Grenoble, 
France). 

1.3) Analyses de gel d'ARN 

On extrait les ARN totaux en utilisant du chlorhydrate de guanidine 
(Logeman et al., 1987) provenant d'embryons congeles a divers stades de 
germination. On fractionne la taille de quantites egales d'ARN sur un gel d'agarose a 
1,2 % contenant du formaldehyde (Sambrook et al., 1989) et on les transfere sur une 
membrane Hybond N (Amersham). On procede aux prehybridations et hybridations a 
42°C dans : formamide a 50 %, 5 x Denhardt, 5 x SSPE, Sarkosyl a 0,5 %, ADN de 
sperme de saumon a 100 jig/ml. On lave deux fois les membranes a 42°C avec 2 x 
SSC, SDS a 0,1 % et une fois a 60°C pendant dix a trente minutes avec SSC a 0,2 %, 
SDS a 0,1 %, avant exposition au film. 

1.4) Surexpression de la proteine codee phy Sll dans Kcoli 
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5 On clone un fragment Nocl-Asel a 1150 pb de PADNc phy Sll (voir 

figure 1) entre les sites Noel et Ndel du vecteur depression pET14 (b) (Novagen). 
On obtient ['expression de la proteine en clonant le vecteur recombinant dans E. coli 
soucheBL21 (Novagen). 

On procede aux extractions et aux analyses des proteines selon les 

10 procedes decrits par le fournisseur. On efFectue les analyses de Western blot avec 

Panticorps purifie par affinite et on detecte Tactivite de phosphatase sur gel de 
polyacrylamide non denaturant, comme il a ete decrit anterieurement (Laboure et al., 
1993). 

LS) Determination de la sequence N-terminale 

15 On electrophorese de la phytase de mai's purifiee sur SDS-PAGE a 12,5 % 

et on efFectue un electro-transfert sur une membrane de PVDF "Problott" (Applied 
Biosystems). La region correspondant a la sous-unite a 38 kDa est revelee par 
coloration avec du noir amido. On procede a une degradation automatisee d'Edman de 
la proteine en utilisant un sequenceur Applied Biosystems 473 A avec les reactifs et 

20 les procedes du fabricant. 

1.6) Cartographie des departs de transcription 

Afin de determiner le depart de transcription, nous avons choisi d'utiliser 
la methode de RACE PCR (Rapid Amplification cDNA Ends, Chenchik 1995). La 
mise en application de cette technique a ete realisee grace au kit "Marathon cDNA 
25 Amplification" de Clontech (Palo Alto, CA, USA). 

Les embryons (axe embryonnaire et scutellum) ages de un jour et un jour 
et demi ont ete broyes separement dans Pazote liquide. Les ARN totaux et les ARN 
messagers ont ete extraits et purifies a partir d'un gramme de broyat suivant les 
indications des kits utilises : "RNAgents Total RNA Isolation System" et 
30 "polyATtract mRNA Isolation Systems" (Promega, Madison WI, USA). 

1.7) Cartographie genetique des loci homologues a l'ADNc phytase 
La technique R F L P (Restriction Fragment Length Polymorphism) a ete 

utilisee. C'est un outil tres performant pour le developpement de cartes de liaisons 
genetiques saturees (Murigneux et al 1993, Theor. Appl. Genet. 87 : 278-287). La 
35 methode Southern (1975, J. Mol Biol. 98 : 503-517) permet la mise en evidence des 

differences individuelles dans la taille des fragments de restriction obtenus avec une 
enzyme donnee et une sonde donnee, qui correspondent a des emplacements definis 
sur le genome e'est-a-dire a des loci genetiques. 
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5 Pour la localisation chromosomique du gene ou des genes correspondant a 

PADNc phytase, la sonde phy Sll - fragment Eco RI / Not I de 1361 pb - a ete 
hybridee sur un transfert d'un gel d'electrophorese contenant PADN digere par Eco 
RI et Hind III de differentes lignees de mais pour lesquelles des descendances en 
segregation 6taient disponibles et utilisees pour la cartographie genetique du mais. Le 

10 croisement A188 x HD7 a ete choisi car un polymorphisme de la taille des fragments 

de restriction homologues a la sonde a ete mis en evidence entre les deux lignees 
parentales. A188 est une lignee americaine (Universite du Minnesota) et HD7 est une 
lignee haploide doublee (Murigneux et al 1993, Theor. Appl. Genet. 87: 278-287) 
issue d'une population synthetique comprenant du materiel d'origine chinoise 

15 essentiellement La sonde phy Sll a par la suite ete hybridee sur des membranes 

contenant PADN de 58 lignees recombinantes SSD ("Single Seed Descent" : lignees 
recombinantes obtenues par filiation monograine) issues de ce croisement. Sur les 
membranes contenant PADN digere par Hind III, deux bandes de tailles differentes 
etaient observees pour chacun des parents. Dans la descendance, ces bandes 

20 cosegregent pour 55*individus, 2 individus possedent les 4 bandes et un seul individu 

presente une bande de chacun des parents. Le meme type de segregation est observe 
pour Phybridation realisee sur les membranes contenant PADN des lignees 
recombinantes digere par Eco RI. 

L8) Construction des genes chimeriques 

25 L8a) Fusions GUS 

Le plasmide pBIOS 255 a ete obtenu par Pinsertion du fragment de 1,3 kb 
provenant de PI 9. 14 restreint a Sac I (position + 749) / Nco I (Nco I se situe au niveau 
de la premiere methionine du gene porte par ce fragment genomique), dans le 
plasmide pRPA-RD-100 coupe a Sac I / Nco I. Ce dernier contient le gene GUS et le 

30 terminateur Nos (Bevan et al. 9 1983, Nature 304 : 184-187). Une deuxieme 

construction avec un fragment promoteur plus grand (2,1 kb) a ete elaboree. Le 
fragment P19.14 restreint a Eco RI / Sph I a ete insere dans le plasmide pBIOS 255 
coupe a Eco RI / Sph I. Le plasmide resultant s'appelle pBIOS 261. 

Le plasmide pBIOS 262 a ete obtenu par Pinsertion du fragment de 1,3 kb 

35 provenant de P23.7 coupe a Eco RI / Nco I (Eco RI, site du polylinker du vecteur et 

Nco I situe au niveau de la premiere methionine du gene pone par ce fragment 
genomique) dans le plasmide pRP A-RD-100 (Eco RI / Nco I). 
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5 L8b) Construction de genes chimeriques permettant une 

expression ectopique de la phytase de classe I (correspondant au 
clone P19.14, cf. BL4) ci-apres) dans le grain et/ou la plante de 
mais 

Dans un premier temps, les inventeurs ont elabore un vecteur plasmidique 
10 de base, denomme pBIOS 256 contenant PADNc phytase accole au terminateur du 

gene de la nopaline synthetase (ter Nos) qui amene un signal de polyadenylation 
fonctionnel chez de nombreuses especes vegetales. Ce plasmide a ete obtenu par 
clonage du fragment Sma I / Eco RV de 300 pb comportant le terminateur Nos (Bevan 
et al 1983, Nature 304 : 184-187) du plasmide pBIOS 250 au site Bst XI (rendu 
15 "bouts francs" grace a Taction de la T4 DNA polymerase) du plasmide phy SI 1. Le 

vecteur pBIOS 2500 avait ete genere par deletion du fragment Sma I du plasmide 
pDM 302 (Cao et al 1992, Plant Cell Reports 1 1 : 586-591). 

I.8bl) Construits porteurs des genes PHYT I (phytase de classe I 
exprimee de fapon constitutive dans le cytoplasme) 
20 Les constructions permettant . Pexpression de la phytase dans le 

cytoplasme de fa?on constitutive ont ete realisees de la maniere suivante : 

- clonage du fragment Hind HI de pBIOS 250 comportant le promoteur Actine - 
intron Actine (pAct) (Mc Elroy et al 1991, MG.G. 231 : 150-160), dans pBIOS 
256 restreint a Hind III. Le vecteur obtenu est appele pBIOS 259 porteur du gene 

25 p Act - PHYT I - ter Nos ; 

- clonage du fragment Bam HI / Nsi I (PHYT I - fragment ter Nos) de pBIOS 256, 
dans les sites Bam HI / Nsi I de pBIOS 220. Le plasmide pBIOS 220 est un 
construit comportant le promoteur 35S du CaMV et le terminateur Nos. Le vecteur 
obtenu est appele pBIOS 264 porteur du gene p35S - PHYT I - ter Nos. 

30 L8blbis) Construits porteurs des genes PHYT I (phytase de 

classe I exprimee dans le cycloplasme de l'albumen du grain 
de mais) 

Les constructions permettant Texpression de la phytase dans le 
cytoplasme de l'albumen ont ete realisees de la fa^on suivante : 
35 - clonage du fragment Bam HI / Nsi I de pBIOS 256 dans les sites BamHI / Nsi I de 

pDV 03000, plasmide contenant le promoteur HMWG (promoteur du gene d'une 
proteine de reserve du ble, la "High Molecular Weight Glutenin" ; Robert et al 
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5 1989, The Plant Cell 1 : 569-578) et le terminateur Nos. Le vecteur obtenu est 

appele pBIOS 258, porteur du gene pHMWG - PHYT I - ter Nos ; 

- clonage du fragment Hind III / Bam HI du plasmide py63 derive de celui decrit 

dans Reina et ai (1990, N.A.R. 18 : 6425-6426) comportant le promoteur y-zeine, 
dans pBIOS 259 digere a Hind III et Bam HI, substituant ainsi le promoteur 
10 Actine et l'intron Actine de riz. Le vecteur obtenu, porteur du gene py-zeine - 

PHYT I - ter Nos, est appele pBIOS 263 ; 

- de fa<?on alternative le clonage sous le controle du promoteur y-zeine peut etre 

obtenu par le clonage du fragment Hind III / Sma I du plasmide py 63 comportant 
le promoteur y-zeine, dans pBIOS 259 digere a Hind III et Eco RV, substituant 
15 ainsi le promoteur Actine et l'intron actine de riz par le promoteur y-zeine. 

Le vecteur obtenu, porteur du gene p y zeine -PHYT I - ter Nos, est appele 
pBIOS 263bis. 

L8b2) Construits porteurs des genes Sec-PHYT I (phytase de 
classe I exprimee de fa^on constitutive dans l'espace 
20 extracellulaire) 

Pour l'ajout du signal d'adressage extracellulaire, nous avons choisi 
d'utiliser celui porte par la "Pathogenesis Related Protein", PR-S homologue a la 
thaumatine du tabac (Cornelissen et al 1986, Nature 321 : 531-532). Les auteurs ont 
opte pour une strategic de mutagenese dirigee utilisant la PCR grace au kit "Ex- 
25 Site™ PCR based Site-Directed Mutagenesis Kit" (Stratagene, La Jolla-USA) selon 

les recommandations du fournisseur. 

Le plasmide pBIOS 256 sert de construction de base. Les oligonucleotides 
utilises pour Tamplification sont les suivants : 

- ol MUP1 : 5' CAT GAA CTT CCT CAA AAG TTT CCC CTT TTA TGC CTT 
30 CCT TTG TTT TGG CCA ATA CTT TGT AGC TGT TAC TC A TGC TGA CTC 

GGA AGG AGT AGC AGC AAA GGT GGC 3' (SEQ ID N° 6), 

- ol MUP2 : 5' GAT CAA AC A CTA AGC TCA ATA AGG ATG G 3'(SEQ ID N° 
7). 

Plusieurs plasmides recombinants tries par analyse de digestion restrictive 
35 ont ete sequences avec le Reverse primer. Un plasmide a ete retenu et la structure du 

gene Sec-PHYT I a ete confirmee par sequen9age grace a trois oligonucleotides : 

- Ml 3-20 primer 

- phy 5 (position 718 / 737 dephy SI 1) 
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- phy 6 (position 8 1 6 / 797 de phy S 1 1 ) 

Le plasmide resultant de I'addition du signal d'excretion et contenant la 
partie codante de la phytase de classe I fiisionnee est appelee pBIOS 265. 

Lors du criblage des plasmides recombinants, le clone M2 n° 61 presentait 
I'addition parfaite de 60 nucleotides sur 76, definissant ainsi seulement une partie du 
signal d'excretion. La sequence du reste de ce plasmide a revele une substitution de 
base dans la partie codante (adenine a la place de guanine en position 853 de phySl 1) 
n'alterant pas l'acide amine code par le triplet d'acide nucleiques affecte. Elle a 
montre egalement I'addition d'un doublet TA dans le partie 3' non traduite, juste 
avant la queue polyadenylee (en position 1334 de phySl 1) 

De fa?on alternative pour obtenir le gene Sec-Phyt I, le plasmide M2 n° 61 
a ete retenu comme matrice de base, pour ajouter la totalite du signal PR-S par une 
deuxieme serie d'experiences de mutagenese dirigee. Les oligonucleotides utilises 
pour ramplifi cation etaient les suivants : 

- ol MUP9 : 5'GGA AGT TCA TGG ATC AAA CAC TAA GCT CAA TAA G3' 

(SEQ ID N° 8) - 

- ol MUP10 : 5' TTA AGA GTT TCC CCT TTT ATG CCT TCC TTT G 3' (SEQ 
IDN°9) 

(Les 15 nucleotides a rajouter sont portes par les deux oligonucleotides) 

200 ng de matrice, 50 pmol des oligonucleotides MUP9 et MUP10, 10 nmol de 

chaque dNTP (Pharmacia, Uppsala, Sweden), 2 unites de Vent DNA polymerase 

(New England Biolabs, Ma USA), dans son tampon pour un volume reactionnel 

de 50 ii\ ont ete soumis aux parametres d'amplification decrits ci-apres (Perkin 

Elmer Cetus 9600 PCR, New Jersey USA) : 

4 cycles - 1 min 95°C 

- 1 min 54°C 

- 4 min 72°C 
21 cycles -40sec94°C 

- lmin61°C 

- 4 min 72°C 
1 cycle - 2 min 72°C 

La totalite du produit d'amplification a ete deposee sur gel d'agarose 1 %. 
La bande correspondant au plasmide mutageneise a ete decoupee puis eluee (Systeme 
Micropure 0,22 + Microcon 50 de Amicon, Ma USA). 
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5 Le produit purifie a ete ligase 16h a 12°C avec 3 unites de T4 DNA Ligase 

(Promega, WI USA), dans un volume reactionnel de 10 Le plasmide a ensuite ete 
transforme dans la souche Escherichia coli XL1 Blue selon les recommandations du 
fournisseur (Epicurian Coli® XL1-BLUE Supercompetent Cells 200236, Stratagene, 
LaJolla USA). 

10 Plusieurs plasmides recombinants tries par analyse de digestion restrictive 

ont ete sequences avec le Reverse primer. 

Un plasmide a ete retenu et la structure du gene Sec-PHYT I a ete 
confirmee par sequen?age grace a trois oligonucleotides : 
-Ml 3-20 primer, 
15 - phy5 (position 718/737 de phySl 1), 

- phy6 (position 816/797 de phySl 1). 

Le plasmide resultant de l'addition du signal d'excretion et contenant la 
partie codante de la phytase de classe I fiisionnee est appele pBIOS 265 bis. 

La construction permettant une expression constitutive de la phytase 
20 excretee a ete obtenue de la maniere suivante : 

- clonage du fragment Hind III de pBIOS 250 comportant le promoteur Actine et 

Pintron Actine, dans le site Hind III de pBIOS 265. Ce vecteur a ete appele 
pBIOS 268 et il porte le gene chimerique p Act - Sec-PHYT I - ter Nos. 

De fa?on alternative, la construction permettant une expression 
25 constitutive de la phytase excretee a ete obtenue de la maniere suivante : 

- clonage, par substitution, du fragment EcoRV / Ncol de p BIOS 265 bis 

comportant le signal d'excretion et l'extremite 5' de la partie codante de la 
phytase de classe I, dans les sites EcoRV / Ncol de pBIOS 259. Ce vecteur a ete 
appele pBIOS 268 bis et il porte le gene chimerique p Act -Sec-PHYT I- ter Nos. 
30 I.8b2bis) Construits porteurs des genes Sec-PHYT I (phytase 

de classe I exprimee dans Pespace extracelluiaire de 
P albumen du grain de mais) 
Les constructions permettant une expression dans V albumen de la phytase 
excretee ont ete obtenues de la maniere suivante : 
35 - clonage du fragment Hind III / Bam HI de py63 comportant le promoteur y-zein 

dans les sites Hind III et Bam HI de pBIOS 265. Ce vecteur est appele pBIOS 269 
et il porte le gene chimerique py-zein - Sec-PHYT I - ter Nos. 
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- clonage du fragment Bam HI / Nsi I de pBIOS 265 comportant Sec-PHYT I et une 
partie du terminateur Nos dans les sites Bam HI / Nsi I de pDV 03000. Ce vecteur 
est appele pBIOS 270 et il porte le gene chimerique pHMWG - Sec-PHYT I - ter 
Nos. 

De fafon alternative, les constructions permettant une expression dans 
P albumen de la phytase excretee ont ete obtenues de la maniere suivante : 

- Clonage, par substitution, du fragment BamHI / Ncol de pBIOS 265 bis 

comportant le signal d'excretion et Pextremite 5' de la partie codante de la 
phytase de classe I, dans les sites BamHI et Ncol de pBIOS 263 bis. Ce vecteur 
est appele pBIOS 269 bis et il porte le gene chimerique p y zeine - Sec-PHYT I - 
ter Nos. 

- Clonage, par substitution, du fragment EcoRI / Smal de pBIOS 265 bis comportant 

le signal d'excretion et Pextremite 5' de la partie codante de la phytase de classe I, 
dans les sites EcoRI et Smal de pBIOS 258. Ce vecteur est appele pBIOS 270 bis 
et il porte le gene chimerique pHMWG- Sec-PHYT I- ter Nos. 

L9) Evaluation de Pactivite promotrice par analyse de Pactivite 
transitoire 

Une etude de Pactivite promotrice peut etre avantageusement realisee en 
introduisant, par la methode du canon a particule, dans des cellules issues du tissu ou 
cette activite est recherchee, la zone promotrice a evaluer fusionnee a un gene 
rapporteur dont Pactivite est facilement decelable. Le gene GUS (E, coli 0- 
glucuronidase) peut etre utilise a cet effet. Chaque cellule ayant re?u ce gene 
chimerique dans des conditions permettant son expression, produit la proteine p- 
glucuronidase. Cette proteine peut etre aisement detectee in situ 48 h apres 
bombardement par la methode decrite par Jefferson (1987, Plant. Mol. Biol. Report., 
5(4) 387 : 405). Les cellules produisent alors un pigment bleu qui permet leur 
observation. Si le promoteur est actif dans le tissu bombarde et au stade considere, 
plusieurs dizaines de cellules a la surface de Pexplant vont acquerir cette couleur 
bleue. Aucun spot ne sera visible si le promoteur est inactif dans les conditions 
utilisees. 

Des grains de mais sont sterilises par immersion de 20' dans une solution 
saturee en Hypochlorite de calcium, puis mis a germer en condition sterile entre deux 
feuilles de papier buvard imbibees d'eau et placees a 25°C. 1 jour, 3 jours et 4 jours 
apres germination les grains sont disseques de fa<?on a placer sur un milieu gelose de 
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5 bombardement, des fragments de tissus tels que aleurone, scutellum, epicotyle et 

mesocotyle. Le milieu de bombardement peut etre par exemple compose de 0,2 M de 
Mannitol et de 0,2 M de Sorbitol solidifie avec 8 g/1 d'Agar. Les tissus sont ensuite 
bombardes. Les plasmides contenant le promoteur a etudier fusionne au gene GUS 
sont purifies sur colonne Qiagen® en suivant les instructions du fabricant. lis sont 
10 ensuite precipites sur des particules de tungstene (M10) en suivant le protocole decrit 

par Klein (1987, Nature 327 : 70-73). Les particules ainsi enrobees sont projetees vers 
les cellules cibles a Paide du canon. L'optimisation des conditions de bombardement 
peut dependre du type d'appareil utilise et fait partie des techniques normalement 
maitrisees par Thomme de Tart. Quarante-huit heures apres le bombardement, les 
15 tissus sont colores comme decrit par Jefferson puis observes. 

1.10) Production de mai's transgeniques 

LlOa) Methode de transformation genet ique 
La transformation genetique du mai's, quelle que soit la methode employee 
(electroporation, Agrobacierium, microfibres, canon a particules) requiert 
20 generalement Tutilisation de cellules indifferenciees en divisions rapides ayant 

conserve une aptitude a la regeneration de plantes entieres. Ce type de cellules 
compose le cal friable embryogene (dit de type II) de mais. 

Ces cals sont obtenus a partir d'embryons immatures de genotype Hi II ou 
A188 x B73 selon la methode et sur les milieux decrits par Armstrong (in The Maize 
25 Handbook ; 1994, M. Freeling, V. Walbot Eds ; pp 665 : 671), les cals ainsi obtenus 

peuvent etre multiplies et maintenus par repiquages successifs tous les 15 jours sur le 
milieu d'initiation. 

Des plantules sont regenerees a partir de ces cals en modifiant l'equilibre 
hormonal et osmotique des cellules selon la methode decrite par Vain ei al. (1989, 

30 Plant Cell Tissue and Organ Culture 18 : 143-151). Ces plantes sont ensuite 

acclimatees en serre ou elles peuvent etre croisees ou auto-fecondees. 

On utilise une methode de transformation genetique conduisant a 
1' integration stable des genes modifies dans le genome de la plante. Cette methode 
repose sur l'utilisation d'un canon a particules. Les cellules cibles sont des fragments 

35 de cals d'une surface de 10 a 20 mm^. lis sont disposes, 4 h avant bombardement, a 

raison de 16 fragments par boite, au centre d*une boite de petri contenant un milieu de 
culture identique au milieu d'initiation, additionne de 0,2 M de mannitol + 0,2 M de 
sorbitol. Les tissus sont ensuite bombardes comme decrit precedemment. 
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5 Les boites de cals ainsi bombardes sont ensuite scellees a l'aide de 

Scellofrais® puis cultivees a Pobscurite a 27°C Le premier repiquage a lieu 24 h 
apres, puis tous les 15 jours pendant 3 mois sur milieu identique au milieu d'initiation 
additionn6 d'un agent selectif dont la nature et la concentration peuvent varier selon le 
gene utilise. Les agents selectifs utilisables sont generalement des composes actifs de 
10 certains herbicides (Basta®, Round up®) ou certains antibiotiques (Hygromycine, 

Kanamycine,). 

II apparait apres 3 mois ou parfois plus tot, des cals dont la croissance 
n'est pas inhibee par r agent selectif, ceux-ci sont habituellement et majoritairement 
composes de cellules resultant de la division d'une cellule ayant integre dans son 
15 patrimoine genet ique une ou plusieurs copies du gene de selection. La frequence 

d'obtention de tels cals est d' environ 0,8 cals par boite bombardee. 

Ces cals sont identifies, individualises, amplifies puis cultives de fa?on a 
regenerer des plantules. Afin d'eviter toute interference avec des cellules non 
transformees, toutes ces operations sont menees sur des milieux de culture contenant 
20 T agent selectif. 

Les plantes ainsi regenerees sont acclimatees puis cultivees en serre ou 
elles peuvent etre croisees ou autofecondees. 

1.10b) Utilisation du gene Bar pour ia selection 
Le gene Bar de Streptomyces hygroscopicus code pour une 
25 phosphinothricine acyl transferase (PAT) qui inactive par acetylation la 

phosphinotricine - molecule active de l'herbicide Basta®. Les cellules portant ce gene 
sont done rendues resistantes a cet herbicide et peuvent etre selectionnees par son 
intermediaire. 

Pour la transformation des cereales, la sequence codante du gene Bar est 
30 sous le controle d'une region regulatrice permettant une expression forte et 

constitutive dans les cellules vegetales. Une telle region peut avantageusement etre 
constituee par le promoteur et le premier intron du gene Actine de riz tels que decrits 
par Mc Elroy (1991, Mol. Gen. Genet. 231: 150-160). 

Ce gene chimerique est clone sur un plasmide permettant son 
35 amplification par Escherichia coli. Ce plasmide pDM 302 Cao (1992, Plant Cell 

Report 1 1 : 586-591), apres amplification puis purification sur colonne Qiagen®* peut 
etre utilise en transformation genetique du mat's en utilisant par exemple la methode 
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decrite precedemment. Dans ce cas les milieux de cultures destines a la selection des 
cellules transformees sont additionnes de 2mg/l de Phosphinothricine. 

Pour Pintroduction des constants phytase devant conduire a une 
expression ectopique des proteines issues des genes PHYT I et Sec-PHYT I, une 
technique dite de cotransformation peut avantageusement etre utilisee. On procede a 
une coprecipitation des deux plasmides (le plasmide porteur du gene de selection et 
Tun des differents plasmides "phytase") sur les particules de tungstene, la quantite 
totale d'ADN precipite sur les particules restant identique a ce qu'elle est dans le 
protocole standard (5 jxg d'ADN pour 2,5 mg de particules) chaque plasmide 
representee environ la moitie du total d'ADN utilise. 

Inexperience montre qu'avec cette methode, la cointegration des 

plasmides dans les cellules vegetales est Pevenement le plus frequent (de Pordre de 

90 %) c'est-a-dire que pratiquement chaque plante ayant integre le gene Bar et ayant 

ete selectionnee par son intermediate portera aussi le gene "phytase". Ainsi, le 

pourcentage de plantes selectionnees exprimant le gene "phytase" est d'environ 70 %. 

Les gene.s ainsi introduits sont generalement lies au sens genetique, le 

gene "phytase" peut ainsi avantageusement etre suivi dans les descendances grace a la 

resistance a V herbicide qui lui est etroitement associee. 

Lll) Amplification des genes de phytase par RT-PCR 

Chaque RT-PCR est realisee sur 10 mg de RNAs totaux prealablement 
traites durant 1 heure a 37°C par la DNase-RNase free (Boehringer) en presence de 
RNasine (Boehringer), dans le but d'eliminer d'eventuelles contaminations par de 
PADN genomique. Les RNAs sont ensuite deproteinises par un traitement au phenol- 
chloroforme et precipites. 

La synthese du brin de cDNA complementaire des RNAs phytases est 
realisee pendant 30 min a 37°C en presence de transcriptase reverse (BRL). La 
transcription est initiee par un oligonucleotide «D« complementaire d'une sequence 
commune aux deux genes hybridant 546 bp en aval de PATG pour le gene I et 552 bp 
en aval de PATG pour le gene II. La sequence de Poligo «D» est la suivante : 
CTGGGAGTAGGCGCGGGAGTG (SEQ ID N° 15). 

Les amplifications sont realisees sur une fraction de la reverse 
transcription, en presence d'un oligonucleotide «C» : 
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5 GCTGTAGCAGTCGCTCACCG (SEQ ID N° 14), commun aux deux genes et 

hybridant 214 bp en aval de TATG pour le gene I et 220 bp en aval pour le gene II. 
Les deuxiemes oligonucleotides utilises debutent a TATG initiateur et sont specifiques 
de chaque gene. L'oligo «A», complementaire du gene I, a la sequence suivante : 
ATGGACTCGGAAGGAGTAGC (SEQ ID N° 12) et l'oligo «B» complementaire du 

10 gene II a la sequence : ATGGACTCGGAAGGAGTTGT (SEQ ID N° 13); 

Les conditions de PCR sont les suivantes : 94°C, 1 min ; 60°C, 1 min ; 
72°C > 1 min, repetees 30 fois. Les produits de PCR sont analyses sur gel d'agarose a 2 
%. 

1.12) Disponibilite du phosphore de mais transgeniques exprimant 
15 ectopiquement la phytase 

Ces mais transgeniques ont ete cultives au champ, et des quantites de 
1'ordre de 16 kg par lot ont ete recoltees. 

L'etudezootechnique consiste a etudier la disponibilite du phosphore de 
ces mais chez le poulet de chair. On retient pour cela deux criteres biologiques de 
20 mesures : retention ou bilan digestif du phosphore et mineralisation osseuse. 

Sur les lots de mais testes ont ete analysees leurs teneurs en phosphore (?) 
total, en P phytique, ainsi que leur activite phytasique selon une adaptation de la 
methode de Bitar et Reinhotd (1972). 

Chaque regime est compose de 3 parties : une base, la source de 
25 phosphore a tester et une partie d'ajustement. 

La base est commune a tous les regimes ; elle assure une apport minimum 
et constant de phosphore et de proteines, ainsi que les oligo-elements et vitamines 
necessaires pour couvrir les besoins des animaux. 

La source de phosphore a tester est constitute par les differents lots de 
30 mais selon l'invention ou bien par le phosphate monocalcique de reference 

(digestibilite de 100%). 

Les lots a tester sont introduits a raison d'environ 50 %, de maniere a ce 
que la quantite de phosphore a tester soit identique pour tous les regimes, et le 
phosphore monocalcique a 3 taux : 0 ; 0,45 et 0,90 %). 
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5 La partie d'ajustement est constitute de matieres premieres n'apportant 

pas de phosphore (aniidon de mais, acides amines, huile, calcium, cellulose) et permet 
d'equilibrer les regimes en acides amines, en energie et en calcium. Seul le phosphore 
des regimes experimentaux est tres en-dessous des recommendations pour le poulet de 
cet age (sinon relargage de P dans ies urines qui sont melangees avec les feces, et 
10 impossibility de mesurer la digestibilite du P). 

Les regimes ont ete granules a la vapeur (presse La Meccanica, type CLM 
200, filiere de 2,5 mm x 35 mm). 

Pour tester Tinfluence du process, certains regimes ont ete testes a la fois en farine, en 
granules (temperature du process de 1'ordre de 60°C) et en granules avec des 
15 temperatures de 1'ordre de 75°C. 

Chaque regime experimental est testes sur 8 repetitions ou cages de 2 poulets males 
ISA JV15 de meme poids. La conduite experimentale est celle decrite par Bruno 
Bamer-Guillotetal(1994). 

Les lots experimentaux sont constitues de : 
20 - un mais temoin seul ; 

un mais temoin additionne de 500 Unites (UP) de phytase 
microbienne ; 

une mais additionne de 1000 Unites (UP) de phytase microbienne ; 
les lots de mais transgeniques selon V invention. 
25 Les aliments experimentaux sont distribues a volonte de J14 a J25. La 

collecte de fientes s'effectue toutes les 24 heures pendant trois jours de J22 a J25. Les 
excreta sont regroupes par cage. lis sont ensuite congeles a - 20°C, puis lyophilises 
pendant 72 heures avant d'etre broyes. Un echantillon par cage est ensuite preleve 
pour la determination de la teneur en phosphore total. A J25, les poulets sont sacrifies 
30 et les deux phalanges centrales du doigt majeur de chaque patte sont prelevees pour la 

determination du taux de cendres. 

La dispohibilite in vivo du P est appreciee selon deux criteres, soit par la 
mesure du P retenu par Tanimal (bilan digestif), soit par le test de mineralisation 
osseuse (Sauveur, 1983). 



WO 98/05785 



PCT7FR97/01443 



32 

Sur chacun des regimes est mesure le coefficient de retention du 
phosphore (CR P). Le CR P des differents mais experimentaux est ensuite calcule par 
difference avec le CR P de la base mesure sur le regime constitue uniquement de la 
base et de la partie d'ajustement. 

La disponibilite du phosphore des mais experimentaux mesuree par le test 
de mineralisation osseuse est calculee par le rapport entre la quantite de cendres 
obtenues avec le regime contenant la matiere premiere, et la quantite de cendres 
obtenue avec les regimes contenant le phosphore monocalcique (calculee par 
regression a l'aide des 3 regimes de cette gamme etalon pour une meme quantite de 
phosphore ingeree). 

1.13) Dosage de r activity phytasique 

I.13.a) Extraction des proteines de mais en vue des dosages 
d'activite phytase 

Un gramme de materiel congele (feuilles ou graines de mais 
transgeniques et jeunes plantules de mais non transgenique - germination agees de 5 
ou 6 jours- ) est broye a 1'etat de poudre dans 1'azote liquide. Le materiel broye est 
transfere dans 10 ml de tampon d'extraction (100 mM acetate de sodium, pH 4,8, 2 
mM CaCl 2 ,l mM DTT, 0,5 a 1 mM Pefablock SC, antiprotease (Interchim, 
Montlu?on)). Les echantillons sont agites energiquement pendant 15 minutes au froid 
et les extraits sont centrifuges 20 min a 8000 rpm (Sorvall, SS34). Les surnageants 
sont recuperes et eventuellement filtres sur miracloth. Ensuite les proteines sont 
precipitees par addition de S04 (NH4) 2 a 60 % de la saturation a 0°C : cette 
precipitation est indispensable, sinon le phosphate provenant des graines et contenu 
dans les extraits interfere avec le dosage. Les culots proteiques sont repris dans 2 ml 
de tampon acetate 50 mM, pH 4,8 et apres resuspension, mis a dialyser sur la nuit 
contre 3 fois 100 ml du meme tampon. Les proteines insolubles apres dialyse sont 
eliminees par centrifugation (on a verifie que ces precipites ne contenaient pas de 
phytase). L'activite est mesuree sur le surnageant. 

L13.b) Mesures d'activite phytase 

II s'agit de la methode de Gibson et Ullah, legerement modifiee (Arch. 
Biochem. Biophys., 1988, 260, 503-513). L'activite est mesuree a 55°C. Chaque tube 
eppendorf (1ml) contient 450 ml acetate de sodium 50 mM, pH 4,8, 2 mM sodium 
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5 phytate et 2 mM CaC12, On ajoute I'extrait a tester, 50 ml dans acetate de sodium 50 

mM, pH 4,8 ; apres 1 h d'incubation a 55°C, !e phosphate inorganique libere est 
mesure de la fafon suivante : on ajoute a chaque tupe 750 ml du melange : acetone : 
5N SO4H2 : 10 mM ammonium molybdate (2:1:1) et 50 ml decide citrique 1M. 
Apres homogeneisation au vortex, les tubes sont centrifuges 3 min a 3000XG pour 

10 eliminer tout precipite du a T acetone. 

Pour chaque essai un temoin identique est garde a 0°C pendant Pheure 
d'incubation. Ce temoin utilise comme zero, permet d'eliminer les absorbances 
possibles dues aux extraits. L'absorbance est mesuree a 355 nm. La quantite de 
phosphate est evaluee a l'aide d'une courbe standard etablie entre 2,5 et 200 nmoles 

15 de phosphate. 

L'activite est exprimee en nmoles de phosphate liberees en 1 heure a 
55°C, par mg de proteines. Les proteines sont dosees sur les extraits par la methode 
classique de Bradford. 

20 H RESULTATS 

ELI) Isolement et caracterisation d'un ADNc codant pour une 
phytase de jeunes plants de mais 

On construit une bibliotheque d' ADNc dans le vecteur d'expression Xgtl 1 
en utilisant des ADNc synthetises avec des ARNm polyadenyles isoles a partir de 

25 jeunes plants de mais ages de trois a quatre jours. On crible la bibliotheque avec 

T antiserum brut de lapin dirige contre la sous-unite de phytase purifiee a partir des 
jeunes plants de mais. Le criblage initial aboutit a 1' isolement de douze clones 
positifs. Lorsqu'on teste avec Tantiserum purifie par affinite sur la sous-unite de 
phytase, un seul clone donne une forte reponse positive. On sous-clone I 1 insert 

30 correspondant dans le vecteur pBS-SK + et on le sequence. II contient 930 pb avec un 

cadre ouvert de lecture codant pour 139 aa. On utilise cet ADNc marque, appele phy 
AM10, comme sonde pour cribler la meme bibliotheque afin de rechercher des clones 
de pleine longueur correspondants. On isole plusieurs clones positifs contenant un 
insert d'environ 1400 pb. On sequence entierement 1' insert d'un de ces clones, appele 

35 ADNc phy S 1 1 . La sequence nucleotidique de l'ADNc phv SI 1 contient 1335 pb avec 

une teneur elevee en GC (65 %) et presente un cadre ouvert de lecture pour un 
polypeptide a 387 aa (figure 1). La presence d'un codon d' arret (TGA) deux codons 
en amont du premier ATG suggere que cet ATG est le codon d' initiation et montre 
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5 que la sequence de codage est complete. Cet ADNc presente 31 pb de sequences non 

traduites en 5' et 147 pb de sequence non traduite en 3\ On trouve un signal de 
polyadenylation AATAAA decrit pour les plantes superieures (Joshi, 1987) (position 
1236 - 41) a 63 nucleotides en amont de 1'extension poly-A. 

La taille de la proteine codee deduite de la sequence d'acides amines est 

10 de 41 kDa, correspondant a la taille de la sous-unite phytase detectee par analyse 

Western blot des proteines totales extraites de jeunes plants (Laboure et al., 1993). II 
faut mentionner que la sous-unite de la phytase purifiee selon le procede decrit 
anterieurement est toujours legerement plus petite (environ 38 kDa), ce qui suggere 
que des clivages specifiques apparaissent au cours de la purification. On determine 

15 l'extremite N sur la sous-unite purifiee. Le peptide a 38 kDa semble etre un melange 

de deux peptides : un peptide mineur avec une extremite N XXEDGESKAGMTDL 
(SEQ ID N° 10) et un peptide majeur commen<?ant par la sequence d'acides amines 
AGMTDLLMLTDKSQL (SEQ ID N° 11). Ces deux sequences qui se recouvrent 
partiellement sont localisees respectivement dans les positions 19- 32 et 27 - 41 sur la 

20 sequence d'aa deduite de l'ADNc phy SI 1 (figure 1), ce qui confirme que cet ADNc 

code bien pour la sous-unite de phytase et que le premier ATG est le codon 
d'initiation. 

Une recherche sur ordinateur des similitudes entre la sequence d'acides 
amines deduite et d'autres proteines dans plusieurs bases de donnees utilisant le 

25 programme FastA de la trousse UWGCG a revele une homologie a 96% avec un EST 

indetermine a 162 pb de Zea mays (numero d'acces : T20338). On a egalement 
trouve une similitude de 55 % (30 % d'identite) avec une sequence d'aa encodee par 
un ADNc d'Hordeum vulgare (numero d'acces : X82937) dont on a signale qu'elle 
est induite par le jasmonate, et dont la fonction est inconnue (J. Leopold, 1994, non 

30 publie). 

Lorsqu'on compare la sequence d'acides amines pour laquelle code 
l'ADNc phy Sll avec celle de la phytase phy A $ Aspergillus niger en utilisant le 
programme Best Fit de la trousse UWGCG, on trouve que la seule zone significative 
de similitude correspond a un recouvrement de seulement 33 aa (souligne en pointilles 
35 dans la figure 1). La figure 2 montre 1'alignement de cette sequence de mais avec les 

sequences correspondantes des phytases Phy A et Phy B (^Aspergillus : cette 
sequence du mais presente 84 % de similitude (27 % d'identite) avec la sequence 
correspondante de la phytase Phy A $ Aspergillus et 79 % de similitude avec celle de 
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5 la phytase de Phy B. Ces sequences des phytases ^Aspergillus contiennent le motif 

consensus RHGxRxP (souligne en figure 2) caracteristique des phosphatases acides de 
la levure, de E. coli et de certains mammiferes, et dont on pense qu'il s'agit de la 
region accepteur de phosphatase (Piddington et al., 1993). 

n.2) Analyse de P expression du gene de phytase par Northern blot a 

10 divers stades de la germination du grain de mais 

Pour examiner si Paccumulation de la proteine signalee dans les jeunes 
plants de mais au cours des premiers jours de la germination (Laboure et al, 1993) est 
en relation avec une augmentation de la teneur en ARNm correspondant, on determine 
les niveaux de produit de transcription par analyse de Northern blot. On extrait TARN 

15 total de semences seches, on hydrate les semences pendant douze heures dans de Peau 

aeree, on transfere les semences dans du sable humide pendant 1, 2, 3, 5 et 6 jours. On 
compare avec PARN extrait de feuilles matures. Dans chaque cas, on soumet 10 \ig 
d'ARN a une analyse de Northern blot, en utilisant PADNc phy Sll comme sonde. 
On ne detecte aucun produit de transcription Phy SI 1 dans les ARN totaux provenant 

20 de semences seches ou provenant de semences imbibees pendant douze heures dans 

de Peau aeree. On trouve que PADNc phy Sll s'hybride a un ARNm unique 
d'environ 1400 pb, qui apparait au cours du premier jour de germination a 26°C, 
atteint son plus haut niveau au jour 2, puis diminue progressivement du jour 3 au jour 
6. On n'observe qu'une tres legere hybridation avec PARNm provenant de feuilles 

25 matures. Cette cinetique de Paccumulation d'ARNm est compatible avec ce qui a ete 

decrit anterieurement pour Paccumulation de phytase, mais le niveau maximum 
d'ARN est obtenu deux jours avant le niveau maximum signale pour Paccumulation 
de proteine. 

IL3) Expression de PADNc phy Sll dans E coli 
30 Pour tester si PADNc phy SI 1 code pour la phytase fonctionnelle du mais, 

on cherche a exprimer le gene dans E. coli. On insere la sequence de codage complete 
en phase au site Nco I du vecteur pET-14b, sous la commande des signaux de 
transcription et de traduction du bacteriophage T7. On transfere le plasmide pET.Sll 
resultant dans Phote depression BL21 dans lequel on peut induire Pexpression de 
35 T7 par IPTG. On extrait les proteines solubles totales provenant de £ coli non 

transformees ou transformees avant et apres induction avec IPTG, dans des conditions 
denaturantes, et on analyse sur SDS-PAGE. La coloration du gel par le bleu 
Coomassie revele une bande faible a 40 kDa, qui n'est presente qu'apres induction par 
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IPTG. Lorsqu'on analyse les memes extraits par analyse de Western blot, on procede 
comme suit : on separe les proteines totales (10 |ig par piste) extraites de E. coli BL21 
sur SDS/PAGE a 12,5 % et on effectue un electrobuvardage sur une membrane de 
nitrocellulose. On repere la proteine avec l'anticorps purifie pour : 1) BL21 non 
transforme, 2) BL21 transforme avec pET14 recombinant, sans induction par IPTG, 
3), 4) et 5) BL21 transforme avec pET14 recombinant au bout de 1, 2 ou 3 heures 
d'induction respectivement, 6) 10 jig de proteines totales de jeunes plants de mais de 
cinq jours et 7) 1 \ig de phytase purifiee a partir de jeunes plants de mais. 

L'anticorps de phytase reagit de fa?on croisee avec un polypeptide 
provenant des extraits de Kcoli induits qui migrent exactement aux memes niveaux 
que le polypeptide detecte sur les proteines totales extraites de jeunes plants de mais 
de cinq jours. De fa?on interessante, la proteine synthetisee dans E coli subit des 
clivages aboutissant a un peptide de meme taille que la sous-unite de la phytase 
purifiee. Lorsqu'on separe des proteines solubles sur PAGE dans des conditions non 
denaturantes et qu'on les analyse par Western blot, on observe une proteine d'environ 
80 kDa dans les extraits de £. coli induits. Cette proteine migre au meme niveau que 
la proteine native provenant de jeunes plants de mais, ce qui indique que les sous- 
unites synthetisees dans E. coli sont capables de s'assembler. Cependant, lorsqu'on 
teste l'activite de phosphatase sur le gel, on n' observe pas d'activite au niveau de la 
proteine reassemblee provenant de Pextrait de £ coli. Lorsqu'on ajoute de la phytase 
de mais purifiee a l'extrait de E. coli une activite est presente, ce qui montre 
qu'aucune substance inhibitrice n'est presente dans l'extrait. 

En resume, I'immunocriblage d'une bibliotheque d'ADNc de jeunes 
plants de mais a permis l'isolement d'un ADNc appele phy SI 1, codant pour un 
polypeptide a 41 kDa qui correspond en fait a la sous-unite de phytase detectee par 
des analyses de Western blot dans des extraits de proteine totale provenant de jeunes 
plants de semis. On a determine la sequence N-terminale de la sous-unite de phytase 
purifiee : on trouve un melange de deux sequences correspondant aux acides amines 
19 - 32 et 27 - 41 de la sequence deduite de 1'ADNc phy SI 1. Ce resultat est en accord 
avec les differences observees entre la taille de la sous-unite revelee par Western blot 
sur les extraits proteiques totaux provenant de jeunes plants de semences et celle de la 
proteine purifiee. La correspondance entre les sequences d'aa determinees sur la 
proteine purifiee et celle deduite d'apres la sequence nucleotidique de PADNc phy 
SI 1, confirme que cet ADNc code bien pour la sous-unite de phytase. 
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5 I/utilisation de l'ADNc phy Sll comme sonde pour estimer les niveaux 

d'ARNm de phytase au cours des premiers jours de germination montre clairement 
que l'accumulation de la proteine signalee anterieurement (Laboure et al., 1993) est en 
correlation avec une forte augmentation du niveau de produit de transcription 
correspondant. En fait, on ne detecte aucun ARNm dans les grains sees ou dans des 

10 grains echelonnes en douze heures, tandis qu'on mesure deja une accumulation 

significative du produit de transcription un jour apres transfert dans des conditions de 
germination. Le niveau maximum d'ARNm est atteint au bout de deux jours, ce qui 
correspond au stade de l'extrusion radiculaire. Par consequent, V induction de 
l'accumulation d'ARNm de phytase se produit a un stade tres precoce du processus de 

15 germination. Dans des travaux anterieurs, on a montre que T accumulation de la 

proteine ne culmine qu'au bout de quatre jours d'imbibition. Cette difference entre la 
cinetique d' accumulation du produit de transcription et de la proteine suggere qu'une 
commande de traduction peut apparaitre outre la regulation du niveau d'ARNm. 

L'expression dans E, coli en utilisant le vecteur pET14 permet la 

20 production de la sous-unite de phytase et son assemblage comme on le detecte par 

Western blot. Cependant, la proteine cible est produite en faible quantite, et on 
n'observe aucune accumulation au bout d'une heure d'induction. La forme assemblee 
migre a la meme taille que la phytase purifiee native, mais la proteine resultante ne 
montre aucune activite de phosphatase. Ceci suggere ou bien que 1' assemblage qui se 

25 produit dans la bacterie n'est pas correct et aboutit a une proteine non fonctionnelle, 

ou bien qu'une modification post-traductionnelle de la proteine necessaire qui ne se 
produit pas dans E. coli est necessaire pour Pactivite. 

II.4) Deux genes phytase sont presents chez le mais et ils sont 
localises sur le chromosome 3 

30 Sur les treize clones genomiques isoles et analyses, dix clones positifs sont 

finalement retenus dont sept sont differents. Les inventeurs ont pu etablir au moins 
deux classes : 

- la classe I qui comprend trois clones differents chevauchants : P3 = P4 (12kb), P19 
(13,5 kb), et P22 (16 kb). Les cartes de restriction sont presentees a la Figure 3, 
35 - la classe II qui comprend deux clones chevauchants : P5 = P26 (17 kb) et P13 = 

P24 (18,5 kb). Les cartes de restriction sont egalement presentees a la Figure 3. 
En ce qui concerne les 2 clones restants : 
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- P23 (12,7 kb, Figure 3) presente un seul fragment de taille identique a un des 
fragments des clones de classe II, fragment qui n'est pas revele a 1'hybridation. Ce 
clone a finalement ete rattache a cette classe apres comparaison des sequences 
effectuees sur les clones phagiques realisees avec I 'oligonucleotide Phy 8, designe 
sur l'ADNc phy Sll a la position 1129 / 1148. Ces dernieres se sont retrouvees 
parfaitement homologues ; 

- P25 quant a lui ne presente aucun fragment retrouve chez les autres clones. 
L'hybridation des blots contenant l'ADN des phages digeres par les differentes 
enzymes enumerees ci-dessus, avec le fragment P23.7 Hind III de 3 kb (Figure 3), 
a montre des differences d'intensite des signaux d'hybridations qui concordent 
avec la classification proposee des fragments genomiques : signal intense pour les 
clones de la classe II et faible pour ceux de la classe I dont P25 ferait partie. 
L'appartenance de P25 a cette classe a pu etre confirmee par hybridation avec le 
fragment Eco RI / Sph I du plasmide portant le fragment P19.14 clone a Sal I / 
Hind III (Figure 4, EcoRI : site du polylinker du vecteur et Sph I : site du fragment 
genomique a la position 1794). 

Des reactions de sequences ont ete egalement menees sur les clones 
phagiques P3, P19 et P22 a Paide d'oligonucleotides specifiques de l'ADNc phytase 
phy SI 1. Les resultats des sequences P3 et P22 obtenues avec 1'oligonucleotide Phy 8, 
designe sur l'ADNc phy SI 1 a la position 1 129 / 11 48, indiquent que le fragment Sal I 
de 6,9 kb commun aux deux clones et homologue a l'ADNc, est adjacent a Tun des 
deux bras du vecteur phagique, au petit bras pour P3 et au grand bras pour P22. P3, 
P22 et PI 9 ont ainsi pu etre positionnes les uns par rapport aux autres (Figure 3). 

Les sequences completes du clone de classe I, P19.14 (4,7 kb) et du clone 
de classe II, P23.7 (3 kb) ont ete determinees et sont presentees aux Figures 4 et 5. Les 
tailles exactes sont 4695 pb pour P19.14 et 2991 pb pour P23.7. 

Des sequences incompletes du clone P13.2 (5,5 kb) et P13.6 (2,6 kb) ont 
montre que le clone phagique dont ils derivent est certainement chimerique. En effet, 
on ne trouve pas d'homologie avec les 100 premieres pb de l'ADNc phy Sll. La 
presence d'un site Mbo I (enzyme utilisee pour la digestion partielle de l'ADN 
genomique lors de la construction de la banque Clontech) a cette position semble 
conforter cette hypothese (position + 122 de phy Sll). 

Les analyses de restriction et d'hybridation du clone P5, revelent que ce 
dernier est aussi chimerique. 
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5 En ce qui concerne le fragment genomique PI 9. 14 (classe I), la 

comparaison de la sequence tiree du fragment genomique et de la sequence de 
1'ADNc phy SI 1, met en evidence un seul intron de 131 pb dans la region 5' leader 
non traduite. L'epissage de Fintron se situerait apres la 13 eme base nucleotidique de 
PADNc phy SI 1. Quelques differences ponctuelles sont observees par rapport a la 

10 sequence de phy SI 1. Ces differences pourraient correspondre a du polymorphisme 

intervari&al (phy Sll vient de la lignee Mol7 et P19.14 de la lignee B73). La 
sequence de phy Sll est entierement retrouvee dans la sequence genomique. Du site 
Nco I situe au niveau du triplet codant pour la premiere methionine, au site Hind III 
de clonage, 2,1Kb permettent de determiner la region promotrice de ce gene. Le cadre 

15 de lecture ouvert determine est le meme que celui de phy Sll, le codon de 

terminaison est egalement TAA. Ce gene coderait done pour une proteine de 387 
acides amines, identique a celle deduite de TADNc phy SI 1 . 

La sequence complete du clone P23.7 (fragment Hind III de 3 kb) a ete 
determinee. D'apres l'alignement des sequences de phy Sll et P23.7, le gene phytase 

20 clone dans P23.7 semble plus eloigne de phy SI 1 que ne Test P19. 14. Les differences 

observees ne sont toutefois pas tres importantes. L'alignement des sequences debute a 
la premiere base de PADNc phytase et a la base 1174 du fragment genomique 
sequence. Un intron de 125 pb est situe dans la region 5' leader non traduite. Une 
vingtaine de mutations ponctuelles sont observees et on peut noter une plus grande 

25 variation entre les sequences au niveau de la region 3' non traduite. Nous avons 

egalement observe une addition de deux fois 3 bases dans la region 5' traduite. Le 
cadre de lecture ouvert demeure ainsi le meme que celui de phy Sll et le codon stop 
est egalement TAA. Le gene clone dans P23.7 coderait pour une proteine de 389 
acides amines. 

30 La comparaison des sequences genomiques de P19.14 et P23.7 en amont 

et en aval de la region transcrite de ces deux genes phytase montre que ces sequences 

etaient totalement differentes. 

L' interrogation des banques de donnees en utilisant la sequence phy Sll 

et le logiciel de comparaison FastA avait montre l'existence d'un EST de mai's de 162 
35 pb, n° d'accession T20338, fortement homologue. Celui-ci provient d'une banque 

d'ADNc obtenue a partir d'ARNm de plantules etiolees de 10 jours de la lignee B73. 

II se revele completement homologue au debut de transcription du gene phytase de 
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classe II (P23.7). On peut noter en particulier, la presence des deux acides amines 
supplemental. 

Les sequences proteiques deduites des parties codantes de P19.14 (classe 
I), P23.7 (classe II) et phy SI 1 ont ete companies grace au logiciel d'alignement 
"clustal V multiple sequence alignement" (Figure 6). Cette analyse a permis de 
confirmer Tappartenance des proteines codees par P19.14 et P 23.7 a des classes 
differentes denomm^es ci-apres respectivement phytase de classe I et phytase de 
classe II. L'anaiyse du cadre de lecture ouvert deP19.14 et de phy SI 1 montre que les 
deux proteines se distinguent uniquement pour deux acides amines (on trouve une 
Alanine et une Valine pour phy Sll, et une Glycine et une Isoleucine respectivement 
pour PI 9- 14). 

En conclusion, ces resultats semblent indiquer que les fragments 
genomiques de classe I correspondraient a l'ADNc phy SI 1. 

Toutes ces donnees attestent done de la presence de deux genes phytase 
transcriptionnellement actifs dans la plantule de mai's en germination. Les sequences 
proteiques de ces deux phytases sont quasiment identiques. 

Parallelement, les resultats de cartographie genetique (cf. materiels et 
procedes) semblent indiquer l'existence de deux loci presentant des homologies de 
sequence avec l'ADNc phytase phy SI 1. Le traitement des donnees avec le logiciel de 
cartographie Mapmaker version 2.0 pour Macintosh (Lander etai 1987, Genomics 1 : 
174-181) a montre que ces deux loci denommes phy I et phy II sont tres lies, 
positionnes a 1 cm Tun de 1'autre sur le chromosome 3 du mai's. lis sont encadres par 
les loci itmcOW et umc026 (MNL 69 : p 249). Phy I est a environ 4,6 cm du locus 
umcOIO du cote du bras court du chromosome et phy II, positionne au meme endroit 
que bnl 06.06, est distant de 4,2 cm du marqueur umc026. 

Une hybridation complementaire a ete realisee sur les membranes 
contenant TADN digere des lignees recombinantes afin d'etablir la correspondance 
entre ces deux loci et les genes de classes I et II caracterisees a partir des fragments 
genomiques. Pour ce faire, le fragment Eco RI / Sph I specifique de la sequence en 
amont du gene de classe I (PI 9. 14) a ete utilise comme sonde. Les resultats des 
hybridations demontrent que le gene de classe I correspond au locus phy L 

H5) Determination du depart de transcription et des regions 
promotrices des genes phytase 
II.5a) Cartographie des departs de transcription 
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5 Pour determiner les departs de transcription des genes phytase, nous avons 

utilise la methode 5'RACE. 

Plusieurs combinaisons d'oligonucleotides ont ete testees : API et AP2 
(Kit Marathon) / phy 20 (position + 95 / + 75 de phy SI 1) ; API et AP2 / phy 18 
(position + 294 / + 273 de phy Sll). Les produits d'amplification obtenus dans les 

10 conditions suivantes : 1 min 94°C ; 40 cycles (30 sec 94°C, 30 sec 55°C, 2 min 68°C), 

n'ont pu etre detectes par coloration au bromure d'ethidium apres migration sur gel 
d'agarose a 2 %. Leur mise en evidence a ete realisee par hybridation avec la sonde 
ADNc phy Sll (EcoR I / Not I). Les produits positifs ont alors ete clones dans le 
vecteur plasmidique pGEM-T (Promega) selon les recommandations du fournisseur, 

15 puis sequences. Differents produits, que Ton peut classer en deux groupes, se sont 

reveles informatifs : 

- le clone n° 53 (obtenu a partir de Poligonucleotide phy 18), beaucoup plus court 
que le produit minimal attendu defini par la sequence de PADNc phy Sll, semble 
mettre en evidence la presence d'une structure secondaire forte en 5' de TARN 

20 messager, qui empecherait une bonne activite de la reverse transcriptase. La 

reverse transcriptase a ete stoppee a la position + 245 de phy Sll; 

- les clones n° 92, 93 et 87 (obtenus a partir de roligonucleotide phy 20), de taille 
sensiblement equivalente a la taille du fragment attendue a partir de PADNc phy 
SI 1. On a pu noter un arret de la reverse transcriptase a 10 pb en amont du debut 

25 de PADNc pour le n° 92 , a la position + 19 pour le n° 93, + 54 pour le n° 87. La 

sequence du clone n° 92 presente 100 % d'homologie avec la sequence determinee 
pour le fragment P23.7 et egalement avec PEST de mai's, n° d'accession T20338. 
Le depart de transcription se situe a la position 1261 de la sequence genomique 
determinee sur P23.7 ou legerement en amont. 
30 Les experiences visant a mettre en evidence les departs de transcription 

des differents genes phytase se sont done revelees fructueuses pour le gene phytase de 
classe II. L'isolement de PADNc phy SI 1 atteste que P initiation de la transcription du 
gene de classe I a lieu a la position 1935 de la sequence genomique ou legerement en 
amont (Figure 4 ou SEQ ID N° 2). 
35 Pour les deux genes on constate la presence d'une bolte TATA a environ 

60 a 70 pb en amont des transcrits trouves. 

IL5b) Expression transitoire 
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Afin d'etudier la specificite des promoteurs des deux genes phytase 
(classes I et II) vis-a-vis des differents tissus de grains de mais en germination, trois 
constructions plasmidiques ont ete realisees. II s'agit de fusions traductionnelles au 
niveau du codon d'initiation avec le gene rapporteur codant pour la (3-glucuronidase 
(Jefferson, 1987, Plant Mol. Report 5 : 387-405). 

En ce qui concerne 1 'etude de la region promotrice du gene de classe I, 
deux fragments genomiques du plasmide P19.14 ont ete fusionnes au gene GUS pour 
analyser l'expression transitoire de la p-glucuronidase. Un fragment long de 2,1 kb et 
un fragment plus court de 1,3 kb. Pour le gene de classe II, un fragment de 1,3 kb a 
ete fusionne (cf. materiel s et precedes). 

Apres bombardement de grains en germination (cf. materiels et precedes), 
une expression transitoire faible (un a deux spots visibles par embryon) a pu etre ainsi 
detectee au niveau du noeud cotyledonnaire d'embryons bombardes un jour apres la 
mise en germination avec les construits suivants : 

- pBIOS 261 (fragment promoteur de 2,1 kb de classe I) 

- pBIOS 262 (fragment promoteur de 1,3 kb de classe II). 

Aucune expression n'a ete decelee dans le scutellum ni dans la couche 
d'aleurone pour ces construits. Aucune expression n'a ete constatee dans aucun tissu 
avec le fragment promoteur court du gene de classe I (pBIOS 255). 

Nous avons done determine qu'au moins un fragment de chaque gene 
phytase (2,1 kb amont du codon start pour la classe I et 1,3 kb amont du codon start 
pour la classe II), peut conferer une expression transcriptionnelle dans certains tissus 
de la plantule de mais. Ces fragments promoteurs des deux genes phytase (contenant 
aussi les leaders avec leur unique intron) peuvent etre utilises pour toutes 
modifications biotechnologiques de diverses plantes. 

Les donnees sur la regulation des genes phytase laissent penser qu'ils ne 
sont transcriptionnellement actifs qu'au moment de la phase germinative. Nous 
disposons done de promoteurs qui ont toutes les chances d'etre specifiques de cette 
etape clef du developpement de la plante et de son rendement. 

Chez le mais, ils peuvent par exemple etre utiles pour diriger la production 
d'un peptide antifongique afin d'augmenter la resistance de la plante aux 
champignons particulierement lors de l'etape de germination. D'autres applications 
comme I'augmentation de la vigueur de germination peuvent etre preferentiellement 
envisages via l'accroissement de la production de certaines hormones comme par 
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5 exemple les cytokinines et les gibberellines. Ceci peut etre obtenu par ['expression 

d'enzymes de biosynthese de ces hormones. 

DL6) Expression ectopique de la phytase de classe I dans le mais 
pour ameliorer la digestibilite du phosphore et augmenter 
Pefficacite d'extraction de 1'amidon de grain de mais 

10 Afin d'augmenter la digestibilite du phosphore du grain de mais et/ou 

d'ameliorer ^extraction de 1'amidon durant Petape industrielle du trempage, nous 
avons adopte plusieurs strategies utilisant toutes une expression ectopique de la 
phytase de classe I. 

n.6a) Expression constitutive dans le cytoplasme 

15 La premiere consiste a diminuer directement la quantite d'acide phytique 

produite dans Tembryon de mais. II est connu que certains mutants de mais, low 
phytic acid J et 2 peuvent avoir une reduction de leur teneur en acide phytique 
pouvant aitteindre 33 % de la quantite totale sans voir une diminution de leur contenu 
en phosphore total (Raboy et aL % 37 Th Annual Maize Genetics Conference 1995, 

20 Asilomar : Asbstract p. 6). Nous avons aussi choisi de produire la phytase de classe I 

dans toute la plante via Tutilisation de promoteurs constitutifs et ceci afin qu'elle 
hydrolyse l'acide phytique en cours de production dans 1'embryon. Comme il semble 
que l'acide phytique soit necessaire au cours du developpement de Tembryon - en 
effet Raboy et ai (37 Th Annual Maize Genetics Conference 1995, Asilomar : 

25 Asbstrac p. 6) ont isole des alleles du mutant Ipa 1 qui sont lethaux, ces derniers 

n'ont plus du tout d' acide phytique - nous avons teste tout d'abord un promoteur 
d'expression constitutive faible chez le mais, le promoteur 35S (Guilley et ai 1982, 
Cell 30 : 763-773). Parallelement l'utilisation d'un promoteur fort, le promoteur 
associe au premier intron du gene Actine 1 de riz (Mc Elroy et ai 1991, M.G.G. 231 : 

30 150-160) a ete developpee. Ces promoteurs dirigeront pour cette strategic l'expression 

de la phytase de classe I telle qu'elle est naturellement exprimee au cours de la 
germination, c'est-a-dire qu'elle sera produite dans le cytoplasme de toutes les 
cellules de la plante (PHYT I). 

II.6b) Expression dans un compartiment cellulaire et/ou un 

35 tissu different de celui contenant Tacide phytique 

Dans une autre strategic, nous visons a produire ectopiquement de la 
phytase de classe I dans le grain de mais sec de maniere a ce qu'elle n'interfere pas 
avec T acide phytique produit dans le germe au cours de la maturation du grain. Cette 
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strategic vise a optimiser la croissance des plantes selon 1' invention. Le but est de 
proceder de telle maniere que la phytase ne soit pas dans le meme compartiment que 
la phytine, et de ce fait n'exercera son activite qu'au moment ou les grains seront 
broyes et ingeres par l'animai ou lors de l'operation de trempage, premiere etape 
industrielle de 1'extraction de l'amidon. 

Pour cette deuxieme strategic, nous utilisons deux approches differentes 
qui peuvent etre combiners pour en faire une troisieme. 

H.6bl) Expression cytoplasmique dans I'albumen 
La premiere consiste a tirer partie de la morphologie du grain de mais en 
exprimant la phytase de classe I de type cytoplasmique (PHYT I) dans le 
compartiment qui ne contient pas d'acide phytique, c'est-a-dire dans l'albumen. Ce 
compartiment tissulaire est tres volumineux et peut permettre l'expression d'une 
grande quantite de phytase. Des promoteurs d'expression specifique de ce tissu sont 
connus et nous avons choisi d'utiliser 2 promoteurs de genes codant pour des 
proteines de reserves de cereales : le premier vient du gene de y-zeine de mais (Reina 
et al. 1990, N.A.R:18 : 6425-6426) le deuxieme vient du gene d'une proteine de 
reserve du ble, la "High Molecular Weight Glutenin" (Robert et al. 1989, The Plant 
Cell 1 : 569-578). 

II.6b2) Expression constitutive dans 1'espace extracellulaire 

La deuxieme approche est semblable a la realisation utilisant une phytase 
fongique (Pen et al 1993, Biotechnology 1 1 : 811-814 et brevet d'invention de Pen et 
al. n° EP-0 449 375) chez le tabac et le colza via l'expression dans un compartiment 
cellulaire different de celui ou se trouve l'acide phytique. Le compartiment choisi 
etant l'espace extracellulaire. Pour cela on rajoute un signal d'adressage 
extracellulaire au debut de la proteine phytase de classe I via une fusion en phase, 
pour donner une nouvelle proteine (Sec-PHYT I). Les signaux d'adressage qui 
permettent un transit via le reticulum endoplasmique puis I'appareil de golgi pour 
terminer dans les vesicules excretrices sont bien connus de l'homme de I 'art. lis sont 
de plus clives lors de la maturation de la proteine ; ceci garantit la production d'une 
proteine quasiment identique a la phytase originelle. Pour cette realisation, nous avons 
choisi le peptide transit d'une "Pathogenesis Related Protein", la thaumatine du tabac 
(Comelissen et al 1986, Nature 321 : 531-532). Ce peptide a ete utilise avec succes 
pour la production d'albumine du serum humain (Sijmons et al. 1990, Biotechnology 
8 : 217-221) et pour la production de phytase A" Aspergillus (Pen et al. 1993, 
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5 Biotechnology 11 : 811-814). Des promoteurs constitutifs peuvent etre bien 

evidemment utilises comme dans la realisation de Pen et al (1993, Biotechnology 1 1 : 
81 1-814). Nous avons choisi le promoteur fort deja mentionne : Actine de riz avec son 
premier intron. 

IL6b3) Expression extracellulaire dans ['albumen 

10 Prenant en compte Topportunite que le mais et les cereales en general ont 

un albumen developpe, on peut combiner les deux approches precedentes a savoir : 
utiliser des promoteurs specifiques de Talbumen pour exprimer la phytase excretee 
(Sec-PHYT I). Les memes promoteurs que ceux utilises pour Pexpression de la 
phytase cytoplasmique, ont ete choisis. Cette troisieme approche garantit un fort taux 

15 depression de la phytase dans le grain de mais assurant son absence d'expression 

dans le germe riche en acide phytique. 

L'expression ectopique de PHYT I et de Sec-PHYT I est detectee dans les 

differents organes des mais transgeniques par la methode Western. 

n.7) Analyse de r expression spatio-temporelle du cDNA phy Sll au 

20 cours de la germination et de la croissance de la plantule 

IL7a) Expression de la phytase au niveau du coleorhize de la 

racine et du coleoptile. 

II est interessant d'observer l'expression phytasique, et plus 

particulierement, son expression dans certains organes de la plante et/ou a certaines 

25 etapes du developpement de la plante. 

Une premiere analyse a ete realisee par Northern blots sur des RNAs 

totaux extraits a divers stades du developpement (1, 2, 4 et 7 jours) de differentes 

parties de la jeune plantule (coleoptile, feuille, scutellum, coleorhize et racine). Les 

resultats des Northerns montrent une accumulation importante du mRNA phytase a 1 

30 jour dans le coleorhize, la racine et le coleoptile. Le signal d'hybridation diminue 

ensuite dans la racine au cours des stades suivants (2, 4 et 7 jours). II continue a 

augmenter dans le coleoptile au moins jusqu'au stade 4 jours. 

Des Northerns ont egalement 6te realises sur les RNAs totaux extraits de 

feuilles ou de racines de plantes adultes (1 mois). Alors qu'aucune hybridation avec 

35 TADNc phytase n'est observee dans le cas des RNAs de feuilles, un signal faible 
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mais significatif est observe avec les RNAs provenant de racines: la presence de 
mRNA phytase est done detectee dans les transcrits provenant de racines adultes, k 
un stade tres post&rieur k la germination. 

Des hybridations in situ, realisees sur les embryons a 1 jour, mettent 
egalement en evidence une accumulation importante du mRNA phytase au niveau du 
coleoptile et de la racine. De plus par immunolocalisation sur des coupes au meme 
stade on a pu localiser la proteine phytase au meme endroit que son mRNA. 

EL7b) Expression de la phytase au niveau de l'endoderme et du 
pericycle racinaires 

La presence de mRNA phytase dans les RNAs totaux de racine adulte a 
conduit a se poser la question de la localisation cellulaire de ce transcrit dans les 
racines. 

Des hybridations in situ sur coupes transversales ( 4, 8 ou 14 jours) ont 
montre que les transcrits phytases sont localises essentiellement au niveau de deux 
assises cellulaires entourant le cylindre central: l'endoderme et le pericycle. On en 
detecte egalement au niveau de l'epiderme. La phytase revelee par immunolocalisation 
se situe au niveau des memes assises cellulaires. L'ensemble de ces donnees montrent 
done une expression tres localisee de la phytase au niveau des racines portant a la fois 
sur le messager, la proteine et l'activite enzymatique. 

L'endoderme est connu pour constituer une barriere physiologique 
importante : e'est au niveau de cette assise cellulaire que se produit la regulation du 
transport selectif des mineraux vers le cylindre central et par la suite vers les parties 
aeriennes de la plante. Ces resultats amenent a penser que ia phytine observee dans les 
cellules de ces assises (Van Steveninck et al., 1993) et son hydrolyse par la phytase 
pourrait jouer un role important dans la regulation des flux de phosphate et de cations 
vers les parties aeriennes. 

L'ensemble de ces resultats suggerent que Tun des deux genes phytase 
s'exprime preferentiellement au cours de la germination dans Pembryon, coleoptile et 
racine, et est implique dans la mobilisation de la phytine stockee dans le germe. 
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5 L'autre gene est plutot specifique de la racine (epiderme, endoderme et/ ou pericycle) 

et est regule de fa^on distincte pour controler l'homeostasie du phosphate et des 
cations dans la plante. Cest ce que demontre Pexemple suivant. 

II.8) Discrimination des transcrits de classe I et II par RT-PCR 

La forte homologie observee entre les sequences transcrites des deux 

10 genes de classe I et II ne permet pas de produire des sondes specifiques de Tun ou 

l'autre gene. II est done difficile a l'aide de telles sondes de verifier l'hypothese selon 
laquelle Tun des deux genes serait specifique de la germination et l'autre des racines. 

Cependant, la comparaison des sequences codantes des 2 genes de classe I 
et II montre la presence de 2 codons supplementaires en 5' du gene de classe II codant 

15 pour deux acides amines supplementaires ( acides amines 7 et 25 de la proteine codee 

par le gene de classe II, Figure 6). 

Mettant a profit la difference resultant de la presence du premier codon 
supplementaire, deux oligonucleotides (20-meres), A (SEQ ID N° 4) specifique du 
gene de classe I et B (SEQ ID N° 5) specifique du gene de classe II ont ete 

20 synthetises. Ces oligos debutent au niveau de l'ATG et se terminent pour B sur le 

premier codon supplementaire et pour A sur le codon suivant. Deux autres oligos 
communs aux deux genes ont egalement ete synthetises : Tun C (SEQ ID N° 6) situe a 
environ 200 pb en aval des 2 premiers, l'autre D (SEQ ID N° 7) situe a environ 300 pb 
en aval de C. 

25 L'oligo D permet en presence de reverse transcriptase et d'une population 

de RNAs totaux de synthetiser par reverse transcription les brins de cDNA 
complementaires des mRNAs phytase. Ces cDNAs sont ensuite utilises pour realiser 
des amplifications par PCR en presence soit du couple d'oligo A+C, soit du couple 
B+C. 

30 Des controles ont montre que la combinaison A+C amplifiait bien 

specifiquement la region correspondante du plasmide contenant le gene I, tandis que 
la combinaison B+C amplifiait specifiquement le cDNA correspondant au plasmide de 
classe II. 

De plus il a ete montre qu'il existait une proportionalite entre la quantite de 
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plasmide utilisee pour la PCR et l'amplification obtenue. 

Les RNAs extraits des differentes parties de la plantule a des stades 
distincts ont ete ainsi testes par RT-PCR. Les premiers resultats realises sur des RNAs 
extraits a 4 jours, montrent que dans le coleoptile seul le gene de classe I est 
abondamment exprime. Dans les RNAs provenant de la racine, les deux genes I et II 
sont exprimes de fa?on a peu pres identique. 

D'apres ces resultats, le promoteur du gene I controle l'expression de la 
phytase dans les organes embryonnaires (coleoptile, coleorhize, racine embryonnaire) 
et regule la mobilisation de la phytine stockee dans Tembryon. De son cote, le 
promoteur du gene II est specifique des assises cellulaires racinaires impliquees dans 
le controle de Thomeostasie des mineraux dans la plante. 

II.9) Analyse de l'expression ectopique de la phytase dans les mai's 

transgeniques : proteine, activite enzymatique et niveau d'expression 
II.9a) Mise en evidence de Pexpression ectopique d'une phytase 
conforme 

L'analyse des transformants primaires a ete realisee tout d'abord par 
analyse Western des proteines isolees de feuilles de plantes acclimatees en serre et de 
graines seches obtenues apres croisement avec du pollen d'une variete elite non 
transformee. Dans ce dernier cas, 6 graines sont broyees simultanement, ceci afin de 
maximiser les chances d'en avoir au moins une contenant le transgene (en theorie 50 
% au moins portent le transgene). 

Les extractions et les westerns ont ete realises comme decrit dans Laboure 
et al., Biochem. J., 1993, 295, 413-419 avec la modification suivante ; avant 
l'electrophorese, les proteines ont ete precipitees au TCA 10 %, lavees 2 fois a 
1'acetone 80 % avant d'etre reprises dans le tampon de depot ; des produits non 
proteiques reagissant avec Tanticorps ont en effet ete trouves notamment dans les 
extraits de feuilles. Ces produits ont ete elimines par cette precipitation. 

Pour les differents genes chimeriques, nous avons pu mettre en evidence 
Pexpression d'une proteine reagissant specifiquement avec les anticorps anti Phytase 
et qui comigrait avec la phytase detectable dans des extraits de germinations agees de 
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5 5-6 jours de ma'fs non transgenique. L'expression dans les feuilles etait detectable 

uniquement avec les genes portes par les plasmides pBIOS 259, pBIOS 264 et pBIOS 
268 bis ; ceci etait attendu car les promoteurs utilises sont constitutifs. Une expression 
dans les graines a aussi ete visualisee sur la majorite des transformants exprimant au 
niveau des feuilles. La taille de la Phytase ectopique exprimee par le construit 

10 constitutif excretion : gene Sec -Phyt I, est identique a celle de la Phytase detectee 

pendant la germination. Ceci indique que la maturation s'effectue bien a Tendroit 
attendu juste apres le signal d'adressage PR-S. 

Pour les transformants ayant integre les genes a expression specifique dans 
Palbumen, comme attendu aucune expression n'a ete mise en evidence dans les 

15 feuilles. Dans les graines, nous avons obtenus pour certains transformants une 

expression ectopique tres forte qui etait superieure a la quantite normalement presente 
dans des extraits de germinations agees de 6 jours. 

Sur la base des resultats western, nous obtenons des taux d' expression qui 
varient dans les feuilles entre 0,005 % et 0,3 % des proteines totales solubles. Dans les 

20 graines, la phytase ectopique varie de 0,03 % a 1 % des proteines totales solubles. 

II.9b) Activate Phytasique dans les feuilles et graines de mai's 
transgeniques 

La detection par western de phytase ectopique ne suffisait pas pour 
25 affirmer que nous avions reussi a avoir une proteine capable d'hydrolyser Tacide 

phytique car des modifications posttraductionnelles peuvent influer sur Tactivite de la 
proteine. Aussi, nous avons dose Pactivite phytasique des extraits transgeniques 
comparativement a des extraits issus de germinations agees de 5 a 6 jours. Cinq 
transformants positifs en western ont ete analyses : 3 au niveau feuille et 2 au niveau 
30 graine. Les resultats sont donnes ci-dessous en nmoles de phosphate inorganique 

liberees en 1 heure a 55°C et par mg de proteines. 



Extraits 



Activite Phytasique 
(nmoles Pi / h / mg de prot.) 
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Germinations 5 jours (Mai's non transforme) 3 500 

Feuilles (pBIOS 264) evenement 2D 1 950 

Feuilles (pBIOS 264) evenement 2H 1 800 

Feuilles (pBIOS 259) evenement 2A 1 000 

Graines seches (pBIOS 258) evenement 1 J 3 050 

Graines seches (pBIOS 258) evenement IF 3 600 



Ces resultats demontrent que la phytase produite selon V invention est 
active biologiquement et parfaitement conforme, notamment dans le grain de mai's qui 
sert debase a l'alimentation des monogastriques, alors qu'il est connu que le mai's non 
transforme (grains et feuilles) possede une activite phytase deficiente et pratiquement 
indetectable. 
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LISTE DE SEQUENCES 



(1) INFORMATIONS GENERALES : 

(i) DEPOSANT: 

(A) NOM: BIOCEM 

(B) RUE: 24 AVENUE DES LANDAIS 

(C) VILLE: AUBIERE 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 63170 

(A) NOM : INSTITUT NATIONAL DE LA RECHERCHE AGRONOMIQUE 

(INRA) 

(B) RUE: 147 RUE DE L'UNIVERSITE 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 75007 

(ii) TITRE DE L' INVENTION: PHYTASES DE PLANTES ET APPLICATIONS 
BIOTECHNOLOGIQUES 

(iii) NOMBRE DE SEQUENCES: 15 

(iv) FORME DECHIFFRABLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D' EXPLOITATION: PC-DOS/MS-DOS 

(D) LOGICIEL: Patentln Release #1.0, Version #1.30 (OEB) 

(vi) DONNEES DE LA DEMANDE ANTERIEURE: 

(A) NUMERO DE LA DEMANDE: FR 9609734 

(B) DATE DE DEPOT: 01-AUG-1996 



(2) INFORMATIONS POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1335 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: ADNc de la phytase de mais 



(ix) CARACTERISTIQUE: 
' (A) NOM/CLE: CDS 
(B) EMPLACEMENT : 32 . . 1192 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 



ATCCATCCTT ATTGAGCTTA GTGTTTGATC C ATG GAC TCG GAA GGA GTA GCA 

Met Asp Ser Glu Gly Val Ala 
1 5 
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GCA AAG GTG GCA GAT GAG ACT ACT AAA CCG GCA AGC CAA GAA GAC GGC 100 
Ala Lys Val Ala Asp Glu Thr Thr Lys Pro Ala Ser Gin Glu Asp Gly 
10 15 20 

GAG AGC AAG GCC GGG ATG ACT GAT CTG CTG ATG CTG ACC GAC AAG TCG 14 8 

Glu Ser Lys Ala Gly Met Thr Asp Leu Leu Met Leu Thr Asp Lys Ser 
25 30 35 

CAG CTG CAG GCG CTA GCG ATG CTG CTG CGG AAC AAC GAG GAG CTC ATG 196 
Gin Leu Gin Ala Leu Ala Met Leu Leu Arg Asn Asn Glu Glu Leu Met 
40 45 50 55 

ATG AGC CAA GCG ATC AAG TCG GAG ACG GAG CGC GTT GAG TAC CTC AAG 24 4 

Met Ser Gin Ala lie Lys Ser Glu Thr Glu Arg Val Glu Tyr Leu Lys 
60 65 70 

ACG GTG AGC GAC TGC TAC ACG CGG ACA ATG AAG CTC CTT GAC GAC TCC 292 
Thr Val Ser Asp Cys Tyr Thr Arg Thr Met Lys Leu Leu Asp Asp Ser 
75 80 85 

ATG GCC GCC AGG ATC ACG TAC GAG CGT TCG GGC GGA ACG AGG AGC CTC 34 0 

Met Ala Ala Arg lie Thr Tyr Glu Arg Ser Gly Gly Thr Arg Ser Leu 
90 95 100 

GTC GCC CGG GAC ATG GAC GAC TAC GTC GTC TAC GGC CTC AAC GCG TGC 388 
Val Ala Arg Asp Met Asp Asp Tyr Val Val Tyr Gly Leu Asn Ala Cys 
105 110 115 

TTG CAG AAC GTC CGC AAC TGC TGC GTG CGT CTG GAC GCC ATC GAC AAG 436 
Leu Gin Asn Val Arg Asn Cys Cys Val Arg Leu Asp Ala lie Asp Lys 
120 125 130 135 

CTG CGG GCG CAC TAC GAC GCC CTC GCC GAC GCC GTC GCC GAA CCG GCC 4 84 

Leu Arg Ala His Tyr Asp Ala Leu Ala Asp Ala Val Ala Glu Pro Ala 
140 145 150 

GCC AAC GTC GAG GGC CTC GCC GCG GAG GCG TCC GAG TAC AAG GCC GCC 532 
Ala Asn Val Glu Gly Leu Ala Ala Glu Ala Ser Glu Tyr Lys Ala Ala 
155 160 165 

ATG TGG CAG TAC TGC TAC AAC CAG CGG AGC GCC TCC GCG CGG GCG CAC 580 
Met Trp Gin Tyr Cys Tyr Asn Gin Arg Ser Ala Ser Ala Arg Ala His 
170 175 180 

TCC CGC GCC TAC TCC CAG GCG CTC AAG CTG GAG GGC ATC GAC TTC GCC 628 
Ser Arg Ala Tyr Ser Gin Ala Leu Lys Leu Glu Gly lie Asp Phe Ala 
185 190 195 

GAG CTT GTG CGG AGG CAC CAG CTC CGG CTC GGG TAC GGC AGC AAG GGC 67 6 

Glu Leu Val Arg Arg His Gin Leu Arg Leu Gly Tyr Gly Ser Lys Gly 
200 205 210 215 

GAG GAG TTC GAG GAC CTG GAC GAC ACC CAG AAG CTG GAG GTG TAC AAC 724 
Glu Glu Phe Glu Asp Leu Asd Asp Thr Gin Lys Leu Glu Val Tyr Asn 
220 225 230 

AGC ATC ATC GTC GAG TCG GGG CGG GCG GGG CTA CCG GTG CGG ATG TTC 772 
Ser He He Val Glu Ser Gly Arg Ala Gly Leu Pro Val Arg Met Phe 
235 240 245 
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TCA TCG GGC CGC TCT GCC GGT GGC CCT AAG ATT GCA GCC ACG ACG TGG 
Ser Ser Gly Arg Ser Ala Gly Gly Pro Lys He Ala Ala Thr Thr Trp 
250 255 260 

GCG CAG GCG GTG AGC GTC TTC ATC ATG GCG GCG GGC AAC CTG GCG TGG 
Ala Gin Ala Val Ser Val Phe He Met Ala Ala Gly Asn Leu Ala Trp 
265 270 275 



820 



868 



GAC GTG TTC ACC ACG GAG CAC GAG GTG GAG GCC ATC CTC AAG GGC AGC 916 
Asp Val Phe Thr Thr Glu His Glu Val Glu Ala He Leu Lys Gly Ser 
280 285 290 295 

CTC AAC CTC CTG GCG GGG CTA GGG GGC TTC GCC GTG GAG GCC GTC GTC 964 
Leu Asn Leu Leu Ala Gly Leu Gly Gly Phe Ala Val Glu Ala Val Val 
300 305 310 

GGC GCG GCT GTC ACC AAG GCG GTC GCA AAC GTC GCC GCC GGC GTC TTT 1012 
Glv Ala Ala Val Thr Lys Ala Val Ala Asn Val Ala Ala Gly Val Phe 
315 320 325 

GCT TGC TCT CTC GCG GGC TTC GTC GTG GGC GCC ATC GCC GGG CTG ATC 1060 
Ala Cys Ser Leu Ala Gly Phe Val Val Gly Ala He Ala Gly Leu He 
330 * 335 340 

TTC GTC GGC GTC AGC GGC CTC CTC ATT AAC CTC ATC ATC GGC TCC CCT 1108 
Phe Val Gly Val Ser Gly Leu Leu He Asn Leu He He Gly Ser Pro 
345 350 355 

AGG AAG GTG CCT GAC ATG AGC AAG CTC ATG TTC CAC ACC GCC GTC ATG 1156 
Ara Lvs Val Pro Asp Met Ser Lys Leu Met Phe His Thr Ala Val Met 
360 365 ~ 370 375 

CCC GAT GGA ATG GCC CTT GCG TAT GCG GTA TCT CAT TAATTACTTA 1202 
Pro Asp Gly Met Ala Leu Ala Tyr Ala Val Ser His 
380 385 

TTATCATCGC AGTCACTACC AATGCAACTG CTTCAGATCC TACTGTTGGA ACGCGTGTGG 1262 

AAATAATAAA GCAATAATAA TAATTATTAT TGTAATAACA ATAATTATGA TATATTGATA 1322 

ATGATTATAT ATC 1335 



(2) INFORMATIONS POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 4695 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 



(ix) CARACTERISTIQUE : 

(A) NOM/CLE: clone classe I / P19.14 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 2097. .3260 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 



AAGCTTTCTG 


AAAAAGTCCA ATCACTAAAA 


TTGAGTTCAG 


AGTAAAAACT 


TATGGCATTT 


60 


TTCGTGAAGC 


TGGTTGTGCA 


GCGGCAATGC 


GACACGGATG 


AGCGGCAGCA 


TAGGGCCTGT 


120 


ATAGCCCCAA 


ACAGCTAGTT 


TTAACCCCAA 


CGACTAGTTT 


TGGTTGGGGT 


TATATTTACA 


180 


CATCCCACGC 


CCTGGGGTCC 


TGCTGGTGTC 


TAGAATAGTT 


CAAACTCATC 


CCAAACCATA 


240 


TTTAAGCCCT 


CTCTAATTCC 


TCTATTTATG 


GGAGCGTGTG 


ACTAGTGTTT 


GATTACGGTT 


300 


AAAGAACTGA 


TTAAGAGCTA GAGAGCAGAT 


CTAGAGCAAG 


ACAACCTTGA 


GCACTTGTCA 


360 


GGCTTCGTCA ACATTCATTG 


CACACTCATT 


ACTCTTGGAG 


GGGAAGCCTC 


CTCAACGGCT 


420 


AGGCGTCCCC 


CGGTGATCTC 


CCATGCTTGT 


TGTGAACCGC 


AGGAAAGTCT 


GTAATTACCC 


480 


CATATCTTAG 


TGAAAAAACC 


AGCTCAGTAT 


TTTGGTGGTG 


AGTTGAAACA 


GACTCCTTTT 


540 


AGCTTCCTCA ACAACATGGA 


CTTAGACATA 


GCCTGACACA 


CTCTTATTTT 


GGATATCTCT 


600 


ACTCCTTTAA AGCACCAGTT 


TCTTGTGTCG 


TGTGTCACGT 


GCGAAACTTG 


TTAGTCTGTT 


660 


GCTCTCCCTT 


GCATCTTGCC 


TGACCATGGA 


CCCAATAGGT 


TGTTATACCA 


TAGATAGGCC 


720 


ATGATAGACT ACCCAACGAG CTCAACCCGA TAGGAAGCCA CACACAACGC AACACTCTCA 


780 


CATAGTACCA 


CCTCGCTAGC 


GGAAGGGAAC 


GAGCGATCGA 


GCGAGCTATA 


AAAATGTTCA 


840 


GTCTGTTTGT 


CATGCCTGGC 


GTGGCCATAA 


TTATTCTTAG 


GGTATGTTAG 


ATTACTTTAG 


900 


TCTCGGTATT 


AAAGTTTAGT 


CATTACTCTG 


TTTGGTTTCA 


GAGATTAAAA 


ATGTTCATAA 


960 


CTCACTAAAA 


AATTTGTAAG 


AAGACCAAAA 


TATTCTTTAT 


CATTCTCTCG 


CCACTACTCT 


1020 


TCTCCCGCGA 


CAACGGAAAT 


AAATAAGGGG 


CAACCATGAA 


ATTGACATGT 


TTTAGGGGTT 


1080 


GTTTGAATGC 


ACTAGAGCTA 


ATAGTTAGTC 


AGCTAAAAAT 


ATACTAGTAG 


AATTAGCTAA 


1140 


CTAACAAATA 


GTTAGCTAAC 


GAGTAGCTAA 


TTTACTAAAA 


ATAGTTAATA 


GCTAAACTAT 


1200 


ATATTAGCTA 


TAGGGTGTTT 


GGATGTCTCT AGCTAATTTT 


AGCTAACTAT 


TATCTCTAGT 


1260 


GCATTCAAAT 


AACCCCTTAA 


TCCCATTTAG 


TCACTCGAGG 


AAC TACT ATT 


TCCGGTGTCT 


1320 


TATTATTTAT 


CGTTTTGGAT 


AAGGTTTGAG 


TAAAACTTAT 


AAATTTTTTA 


CTATAAATAA 


1380 


CTATTTTGAT 


ATTAGTTTGA 


AAACCTAATA CTTATATGCA 


TAGGTTTGTC 


TTAAAAAGTA 


1440 


CTTTTATAAA 


AGTATAAATG 


TAATAAGAGT 


TTATTTGTAT 


TTTAGGAAAA 


AACATCGGTC 


1500 


AAAGCTATAT 


ATATTTTGGA 


GACTATATCG 


TTGTCCTAAA 


CGACAATAAA 


AAGGCACCGA 


1560 


GAGAGTAGGG 


ACTAAAGCGG 


TTTAATCTAT 


CCTTTACTGT 


TATTGTTTGA 


TAATTTATGG 


1620 


ATTAATGAGA 


CTAAAATTCT 


ATGACTAATC 


TTTAGTCCCC 


AAACTAAACA 


AACCCTTAGT 


1680 
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ATGATTGATC CTGGACAGCA TACAGACCCA TGCTTAACTT GATACAACAC CAACAAGACC 1740 

AGACCCCACC CCCTTCCCTA TCAACGGAGG GATGATATAT TATTTAAGTG CATGCGCGTG 1800 

CTGCACGCTG TTATGGACCT ATTTGGTAGG ACTAGGAGTA GGATATATAT CACAAAGTTG 1860 

TATACCTATA AATAGCTCGC TTTGATCATA TGATCTGCTG CCTTATACGA AACATAGCTA 1920 

CTCCTACTAC TCAAATCCAT CCTTATTGTA AGTGCGGTCT TATAAGCTAC TACTAGTTAC 1980 

AAGCTGGTTT ATACTTAACT ACAAGTAGCA ACGATTTGCC TTAGTATATA TGGTTCATAA 2040 

TACATAAATA TTGGAACTGA GACAATATAT ATATGCAGGA GCTTAGTGTT TGATCC 2096 

ATG GAC TCG GAA GGA GTA GCA GCA AAG GTG GCA GAT GAG ACT ACT AAA 2144 
Met Asp Ser Glu Gly Val Ala Ala Lys Val Ala Asp Glu Thr Thr Lys 
1 5 10 15 

CCG GCA AGC CAA GAA GAC GGC GAG AGC AAG GCC GGG ATG ACT GAT CTG 2192 
Pro Ala Ser Gin Glu Asp Gly Glu Ser Lys Ala Gly Met Thr Asp Leu 
20 25 30 

CTG ATG CTG ACC GAC AAG TCG CAG CTG CAG GCG CTA GCG ATG CTG CTG 2240 
Leu Met Leu Thr Asp Lys Ser Gin Leu Gin Ala Leu Ala Met Leu Leu 
35 40 45 

CGG AAC AAC GAG GAG CTC ATG ATG AGC CAA GCG ATC AAG TCG GAG ACG 2288 
Ara Asn Asn Glu Glu Leu Met Met Ser Gin Ala lie Lys Ser Glu Thr 
50 55 60 



GAG CGC GTT GAG TAC CTC AAG ACG GTG AGC GAC TGC TAC ACG CGG ACA 2336 
Glu Arg Val Glu Tyr Leu Lys Thr Val Ser Asp Cys Tyr Thr Arg Thr 
65 ™ 75 80 

ATG AAG CTC CTT GAC GAC TCC ATG GCG GCC AGG ATC ACG TAC GAG CGT 2384 
Met Lys Leu Leu Asp Asp Ser Met Ala Ala Arg lie Thr Tyr Glu Arg 
85 9° " 

TCG GGC GGA ACG AGG AGC CTC GTC GCC CGG GAC ATG GAC GAC TAC GTC 24 32 

Ser Gly Gly Thr Arg Ser Leu Val Ala Arg Asp Met Asp Asp. Tyr Val 
100 105 11° 

GTC TAC GGC CTC AAC GCG TGC TTG CAG AAC GTC CGC AAC TGC TGC GTG 24 80 

Val Tyr Gly Leu Asn Ala Cys Leu Gin Asn Val Arg Asn Cys Cys Val 
115 120 125 

CGT CTG GAC GCC ATC GAC AAG CTG CGG GCG CAC TAC GAC GCC CTC GCC 2528 
Arg Leu Asp Ala He Asp Lys Leu Arg Ala His Tyr Asp Ala Leu Ala 
130 135 I 40 

rar GCC GTC GCC GAA CCG GCC GCC AAC GTC GAG GGC CTC GCC GCG GAG 2576 
Asp Ala vll Ala Si Pro Ala Ala Asn Val Glu Gly Leu Ala Ala Glu 
145 150 155 

rrc -CC GAG TAC AAG GCC GCC ATG TGG CAG TAC TGC TAC AAC CAG CGG 2624 
Sa Ser til ly: 5» Ala Ala Met Trp Gin Tyr Cys Tyr Asn Gin Arg 
165 l" 70 1 

AGC GCC TCC GCG CGG GCG CAC TCC CGC GCC TAC TCC CAG GCG CTC AAG 2672 
Ser Ala Ser Ala Arg Ala His Ser Arg Ala Tyr Ser Gin Ala Leu Lys 
180 I 85 iyu 
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CTG GAG GGC ATC GAC TTC GCC GAG CTT GTG CGG AGG CAC CAG CTC CGG 2720 
Leu Glu Gly He Asp Phe Ala Glu Leu Val Arg Arg His Gin Leu Arg 
195 200 205 

CTC GGG TAC GGC AGC AAG GGC GAG GAG TTC GAG GAC CTG GAC GAC ACC 2768 
Leu Gly Tyr Gly Ser Lys Gly Glu Glu Phe Glu Asp Leu Asp Asp Thr 
210 215 220 

CAG AAG CTG GAG GTG TAC AAC AGC ATC ATC GTC GAG TCG GGG CGG GCG 2816 
Gin Lys Leu Glu Val Tyr Asn Ser He He Val Glu Ser Gly Arg Ala 
225 230 235 240 

GGG CTA CCG GTG CGG ATG TTC TCG TCG GGC CGC TCT GCC GGT GGC CCT 2864 
Gly Leu Pro Val Arg Met Phe Ser Ser Gly Arg Ser Ala Gly Gly Pro 
245 250 255 

AAG ATT GCA GCC ACG ACG TGG GCG CAG GCG GTG AGC GTC TTC ATC ATG 2912 
Lys He Ala Ala Thr Thr Trp Ala Gin Ala Val Ser Val Phe He Met 
260 265 270 

GCG GCG GGC AAC CTG GCG TGG GAC GTG TTC ACC ACG GAG CAC GAG GTG 2960 
Ala Ala Gly Asn Leu Ala Trp Asp Val Phe Thr Thr Glu His Glu Val 
275 280 285 

GAG GCC ATC CTC AAG GGC AGC CTC AAC CTC CTG GCG GGG CTA GGG GGC 3008 
Glu Ala He Leu Lys Gly Ser Leu Asn Leu Leu Ala Gly Leu Gly Gly 
290 295 300 

TTC GCC GTG GAG GCC GTC GTC GGC GCG GCT GTC ACC AAG GCG GTC GCA 3056 
Phe Ala Val Glu Ala Val Val Gly Ala Ala Val Thr Lys Ala Val Ala 
305 310 315 320 

AAC GTC GGC GCC GGC GTC TTT GCT TGC TCT CTC GCG GGC TTC GTC GTG 3104 
Asn Val Gly Ala Gly Val Phe Ala Cys Ser Leu Ala Gly Phe Val Val 
325 330 335 

GGC GCC ATA GCC GGG CTG ATC TTC ATC GGC GTC AGC GGC CTC CTC ATT 3152 
Gly Ala He Ala Gly Leu He Phe lie Gly Val Ser Gly Leu Leu lie 
340 345 " 350 

AAC CTC ATC ATC GGC TCC CCT AGG AAG GTG CCT GAC ATG AGC AAG CTC , 3200 
Asn Leu lie lie Gly Ser Pro Arg Lys Val Pro Asp Met Ser Lys Leu 
355 360 " 365 

ATG TTC CAC ACC GCC GTC ATG CCC GAT GGA ATG GCC CTT GCG TAT GCG 3248 
Met Phe His Thr Ala Val Met Pro Asp Gly Met Ala Leu Ala Tyr Ala 
370 375 380 

GTA TCT CAT TAA TTACTTATTA TCATCGCAGT GACTACCGAT GCAACTGCTT 3300 

Val Ser His * 

385 

CAGATCCTAC TGTTGGAACG CGTGTGGAAA TAATAAAGGA ATAATAATAA TTATTATTGT 3360 

AATAACAATA ATTATCATAT ATTGATAATG AT TAT AT ATC AAATAGCTTC TCTCGATTCG 34 20 

TCGTGACACA CGTCACATGA GTCCATGGTG TGCCCCGCTT CGCACGACCC ACG AC CGG AC 34 80 



AGACAATTTT AGCTGAGTGT TAAATTTTTG TCTCGAGTAC AAATCCACGG GGCAAAGAAA 354 0 
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GGCCATCGAG CAAATCGAAC ATTTATTTAG TGTCAGACAC TCGGTAAAGA AATCAAATTT 3600 
TTGGTGTGAA CACTTAACAA AGAAAAACAA TCAGTAAAAA GGTGGTTTAA CTAATATCGG 
ATACTTATCA AATAAAAATG CTCGACAAAA AGTGGTTTGG CTAGTGTCAC CATCAGCAAC 
TAATACCACC TAACCACCAT TCTTTTTGCC GAGTGTCCTA CCGCGTCACT CGTCAAAGGA 
GGCCTCTTTG TTTGGTACCA TTTCTAGACT CTAGTTAAAT AGGTATTTGC CTAGCGTCAG 
CTCAGAATAG GAGGCAAAGA TGCACTTTGT GTATTATTAT CTTCTTTTAC ACCCAACAAA 
GTATTTTTTA TTTTTTTCTT CTTGCCCTAA AACTTGTTCT GCTATATTCC TATAACACCT 
AGAACTACAT GTTCAGTTTT GGTACATTTC TCAGTGTTTT GTAGATTTAG TAAATTTATT 
TTATTTAACT GAATTTCTTG AGATAATTCA AATTTGAACG GTAAGTCATT CGTATAATGA 
AAACATGAAT AGAAAACAGA TGTTCATGTT ACTAAGTATA AGTTGAGGTC GTATACAATA 
ATAGACCAGA AAATTCGAAC ATTATGTTCA CGAAATATCA CCATGTACAA TTGTTTTTAA 4200 
ATTGTATAAA AAGCAAACGA AGTTTGAAAA ATTATAAAAC TTTCGGGATG TCATGATATC 4260 
ATAAGTGGAG GCTATAATAA AAGGTTGATA AAGTTTCATT AAAGTTTGAC ATGTACTATG 
GTTACCACCT AATCAATCTC CATATGAAAC AAATCATGAA ACATATTCGT CGATTCTTCG 
GTTTGTAAAC ATTCATGAAA TCATGTCAAC TTTTTATCAC AGCCTCCACA TATAAACTAT 
CATGATTTTC TAACTTTGTT TGCTTTTTAT ATAATTTAAA AACGGTTTTT TGGACACTAG 
GCAAAGAGCT TCTTTGCCAA GTGTTTTTTG GACTCTTGGC AAAGACAATA GTTGGAAACT 
TTTTGATTTG AAGACATCTT GTCAATGAAA ACTATGTCTG AATTTTTTTA AAAATGTAAT 
TCAAAATTTT CAAATGACCT CGAATGAAAA AATCACCAAA ATAATAGTTG TAGATCCGTT 
GACCTGCAGG TCGAC 

(2) INFORMATIONS POUR LA SEQ ID NO: 3: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2990 paires de bases 

(B) TYPE: nucleotide 

(C) N OMB RE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: clone classe II / P23.7 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 1329. .2495 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 3: 



3660 

3720 

3780 

3840 

3900 

3960 

4020 

4080 

4140 



4320 
4380 
4440 
4500 
4560 
4620 
4680 
4695 
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AAGCTTAAAG ATCCCATTGG AAGTTAAACT CTCGGAAAGA GTTGATCGGA TGTTAGACTA 60 

ACTTCTGACG GTCGTTGGGG CCCATCGGAA GTTAGCGACG TAGACGTTGT TAGCACCGAA 120 

ACTTCTAACC ATTTTAGTGG CCTCTCGGAA GTTATTGTGC TAACTTCCAA GGGGTCCCAC 180 

CGGCTTCTCA AAAGTTAATG TGCTAACTTC AGGCCATTTT AGTGGCCTCT CGAAATTTAT 24 0 

ATTGAACCAA CATTCAAAAT GTTATTTATT TTCAAATTTC ACTATATTTC AATACATCGG 300 

GATACCAACC ATGCGGAAAA CAACACTAAC TGCAATAGCA TCTCATCTGT TTCATCACAA 360 

TAACACCACA CCTCATAAAT CTCATCAATT AAACACAATT CCAATATATT TCTTCAAAAT 420 

AAGAACTCAA TTAGTCTCAT CTCAACCCAA GACACATCCC AAATGTCTTA CAGGGTTCAC 480 

AAGTTCACCT CCCATCTATT TGAACTATAT CTTATATATT AACAAACAAC ATTAGTTTAA 54 0 

ATATCATACA TTTAGTTATG TCTCTTTCCT CATTTTTACT CGTAGCCATG ATTTTTGTTT 600 

AGTTTTGCCT CTTCTGCTCT TCAGCAACAG AATAACAAAA CTGAGTAGAA AATACAACTA 660 

AGGGTAAAAA TAAGGAAAGC GGTAGAACTA ACGGCACCAC TTCAAAATGT CGTAGTTTAA 720 

ATAATTTGAT GTTCATCAAA TACTAAAATT CAAAATTAAA GACCTCTAGA GTATATTTTT 780 

CTTACAAGCT CCAGTGGTGG CCGTGCCTCG CGTGGCCATA ATCATCCTTA GTATGATTGA 84 0 

TCATGGACAG GGTACAGACC CATGCTTGAC TTGATAAAAC ACCAACAATA CCAGACCCCA 900 

TCCCCTTCCC TATCAACAAC GGAGGGACGA TGATATATTA TTTAGGTCTT GTTCGGATAC 960 

TCTACTATTA TATTCACTCT AAATCATATG TGTTAATACT AGAGTACCTA AACAAGGTCT 1020 

TAAGTGCATG CACGTGCTGC ACGCTGTTAT GGACCTATTA GGTAGTAGTA GGTCGAGTAG 1080 

GATATATATC ACAAAGTTGT ATACCTATAA ATAGCTCGCT TTGATAACAT GATCTGCTGC 114 0 

CTTATACGAA AC AT AG CT AC CTACTACTCA AGTATCCATC CTTATTGTAA GTGCTCTTAT 1200 

AAGCTACTAC TAGTTACAAG CTGGTTTATA TTTAACTACA AGTAGCAACG ATTTGTCTTA 12 60 

GTATATATGG TTCATAATAC ATATATATTG GAACTGAGAT AATATATGCA GGAGTACAGT 1320 

GTTGATCC ATG GAC TCG GAA GGA GTT GTA GCA GCA AAG GTG GCA GAT GAG 1370 
Met Asp Ser Glu Gly Val Val Ala Ala Lys Val Ala Asp Glu 
15 10 

ACT ACT AAA CCG GCA ATC CAA GAA GAC GGC GCC GAG AGC AAG GCC GGG 1418 
Thr Thr Lys Pro Ala He Gin Glu Asp Gly Ala Glu Ser Lys Ala Gly 
15 20 25 30 

ATG ACT GAT CTG CTG ATG CTG ACC GAC AAG TCG CAG CTG CAG GCG CTG 14 66 
Met Thr Asp Leu Leu Met Leu Thr Asp Lys Ser Gin Leu Gin Ala Leu 
35 40 45 

GCG ATG CTG CTG CGG AAC AAC GAG GAG CTC ATG ATG AGC CAG GCG ATC 1514 
Ala Met Leu Leu Arg Asn Asn Glu Glu Leu Met Met Ser Gin Ala He 
50 55 60 
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AAG TCG GAG ACG GAG CGC ATT GAG TAC CTC AAG ACG GTG AGC GAC TGC 
Ser Glu Thr Glu Arg lie Glu Tyr Leu Lys Thr Val Ser Asp Cys 
65 7 ° 75 

TAC ACG CGG ACG ATG AAG CTC CTC GAC GAT TCC ATG GCG GCC AGG ACC 
Tyr Thr Arg Thr Met Lys Leu Leu Asp Asp Ser Met Ala Ala Arg Thr 
80 85 

ACG TAC GAG CGT TCG GGC GGA ACG AGG AGC CTC GTC GCC CGG GAC ATG 
S lyr Gin Arg Ser Gly Gly Thr Arg Ser Leu Val Ala Arg Asp Met 
95 100 iUD 

£ SS £ £ | S SS SS ££ S £ S - - i S 

s s ss a s = - s s ss ss s s s s s 
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Glv Leu Gly Gly Phe Ala Val Glu Ala Val Val Gly Ala Ala Val Thr 
305 310 315 

AAG GCG GTC GCA AAC GTC GGC GCC GGC GTC TTT GCT TGC TCT CTC GCC 2330 
Lys Ala Val Ala Asn Val Gly Ala Gly Val Phe Ala Cys Ser Leu Ala 
320 325 330 

GGC TTC GTC GTG GGC GCC ATC GCC GGG CTG ATC TTC GTC GGC GTC AGC 2378 
Glv Phe Val Val Gly Ala He Ala Gly Leu He Phe Val Gly Val Ser 
335 340 345 350 

GGC CTC CTC ATT AAC CTC ATC ATC GGC TCC CCA AGG AAG GTG CCT GAC 2426 
Gly Leu Leu He Asn Leu He He Gly Ser Pro Arg Lys Val Pro Asp 
355 360 365 

ATG AGC AAG CTC ATG TTC CAC ACC GCC GTC ATG CCC GAT GGA ATG GCC 2474 
Met Ser Lys Leu Met Phe His Thr Ala Val Met Pro Asp Gly Met Ala 
370 375 380 

CTT GCG TAT GCG GTA TCT CAT TAATTACTTA ATATCATCGC AGTGACTACC 2525 
Leu Ala Tyr Ala Val Ser His 
385 

AATGCAACTG CTTCAGCTCC TACTGTTGCA ACGCGCGTGT GGAAATAAGA AGGGAATAAT 2585 

AATAATTATT ATTATTGTAA TAAAAAATAA TT ATC AT AT A TTGATAATGA T TAT AT ATC A 264 5 

AATATCTTTT CTCGATTCGT CGTGACACAC GTC AC AT GAG TCCATGGTGC ACGCCTTCGC 2705 

TCGACCCACG ACCAGACAAT TTTAGCTGAC GTCCCGTTTA GAC T CAT TAG AATTGAATTT 2765 

CATTCTAATA ATAGTAATTT AGGCATATAT TAACTAAGAT AATTCGATTT TATACAAAAT 2825 

ATATTGGTAT ATTATTATTA GTAAGATGTC GAAGATATTT ATGTGCTACA TTTTTACTAT 2885 

AGAGGAGTGA GACGAAAAGT GTCATGTAAG TTATATAGAA GAAACAAATT CTACTCATGC 294 5 

ATAAAATCAT TTCTCATCCC CCACCCCATG AATTTGAGAT AAGCTT 2991 



(2) INFORMATIONS POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 16 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 



(ix) CARACTERISTIQUE: 
(A) NOM/CLE: U5 



(Xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 4: 
AACAGCTATG ACCATG 
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(2) INFORMATIONS POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

(ix) CARACTERISTIQUE: 
(A) NOM/CLE: U3 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 5: 

18 

GTAAAACGAA CGGCCAGT 

(2) INFORMATIONS POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 105 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: ol MUP1 

(xi) DESCRIPTION DE LA' SEQUENCE: SEQ ID NO: 6: 
CATGAACTTC CTCAAAAGTT TCCCCTTTTA TGCCTTCCTT TGTTTTGGCC AATACTTTGT 60 
AGCTGTTACT CATGCTGACT CGGAAGGAGT AGCAGCAAAG GTGGC 
(2) INFORMATIONS POUR LA SEQ ID NO: 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 28 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: ol MUP2 



105 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7: 
GATCAAACAC TAAGCTCAAT AAGGATGG 
(2) INFORMATIONS POUR LA SEQ ID NO: 8: 
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(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 34 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 



(ix) CARACTERISTIQUE : 

(A) NOM/CLE: ol MUP9 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8: 
GGAAGTTCAT GGATCAAACA CTAAGCTCAA TAAG 



(2) INFORMATIONS POUR LA SEQ ID NO: 9: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 30 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: ol MUP10 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 
TTAAGAGTTT CCCCTTTTAT GCCTTCCTTT 
(2) INFORMATIONS POUR LA SEQ ID NO: 10: , 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 14 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: peptide mineur 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 

Xaa Xaa Glu Asp Gly Glu Ser Lys Ala Gly Met Thr Asp 
! 5 10 
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(2) INFORMATIONS POUR LA SEQ ID NO: 11: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 15 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: peptide majeur 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 

Ala Gly Met Thr Asp Leu Leu Met Leu Thr Asp Lys Ser Gin Leu 
1 5 

(2) INFORMATIONS POUR LA SEQ ID NO: 12: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: oligo A 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 
ATGGACTCGG AAGGAGTAGC 

(2) INFORMATIONS POUR LA SEQ ID NO: 13: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: oligo B 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 
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ATGGACTCGG AAGGAGTTGT 

(2) INFORMATIONS POUR LA SEQ ID NO: 14: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: oligo C 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14: 
GCTGTAGCAG TCGCTCACCG 

(2) INFORMATIONS POUR LA SEQ ID NO: 15: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: oligo D 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15: 
CTGGGAGTAG GCGCGGGAGT G 
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5 REVENDICATIONS 

I. Sequence d'ADN identique ou homologue a plus de 70 % de tout ou partie 
de la sequence telle que d&inie dans SEQ ID N° 1 . 

10 2. Sequence d'ADN identique ou homologue a plus de 70 % de tout ou partie 

de la sequence telle que definie dans SEQ ID N° 2. 

3. Sequence d'ADN identique ou homologue a plus de 70 % de tout ou partie 
de la sequence telle que definie dans SEQ ED N° 3, 

15 

4. Sequence d'ADN caracterisee en ce qu'elle comprend tout ou partie d'une 
sequence complementaire ou complementaire de l'homologue d'une sequence selon 
Tune des revendications 1 a 3. 

20 5. Utilisation d'une sequence selon Tune des revendications 1 a 3 comme 

sonde moleculaire. 

6. Fragment d'acide nucleique codant pour une phytase de plante. 

25 7. Fragment d'acide nucleique selon la revendication 6, caracterise en ce qu'il 

code pour une phytase de cereale. 

8. Fragment d'acide nucleique selon la revendication 6 ou 8, caracterise en ce 
qu'il code pour une phytase de mai's. 

30 

9. Fragment selon la revendication 6, 7 ou 8 caracterise en ce qu'il s'agit d'un 
fragment d'ADNc. 

10. Fragment d'acide nucleique selon l'une des revendications 6 a 9 caracterise 
35 en ce qu'il comprend tout ou partie d'une sequence de nucleotides substantiellement 

telle que montree dans 1'identificateur de sequences (SEQ ID) n° 1 codant pour une 
activite phytase. 

II. Fragment selon la revendication 10, caracterise en ce qu'il comprend tout ou 
40 partie de la sequence codante allant du nucleotide n° 32 a 1 192 de SEQ ID n°l. 
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12. Fragment selon Tune des revendications 10 ou 11, caracterise en ce qu'il 
comprend la sequence complete de 1335 nucleotides telle que montree sur SEQ ID n° 
1. 

13. Fragment selon la revendication 6, 7 ou 8, caracterise en ce qu'il s'agit d'un 
fragment d'ADN genomique. 

14. Fragment selon la revendication 13, caracterise en ce qu'il comprend tout ou 
partie de la sequence telle que definie dans SEQ ID N° 2 ou SEQ ID N° 3. 

15. Fragment caracterise en ce qu'il comprend tout ou partie d'une sequence 
complementaire, homologue ou complementaire de I'homologue d'une sequence telle 
que selon Tune des revendications 10 a 14. 

16. Fragment d'acide nucleique selon la revendication 15, caracterise en ce 
qu'il comprend de l'ADN genomique de la plante. 

17. Fragment d'acide nucleique selon la revendication 15, caracterise en ce 
qu'il est constitue par de PADNc et comporte en outre une partie des fragments 
introniques de l'ADN genomique. 

1 8. Promoteur d'un gene de phytase de plante. 

19. Promoteur d'un gene de phytase de cereale. 

20. Promoteur d'un gene de phytase de ma'fs. 

21. Promoteur d'un gene de phytase de plante selon la revendication 18, 
caracterise en ce qu'il contient tout ou partie du fragment allant du nucleotide n° 1 au 
nucleotide n° 2096 de la sequence telle que definie dans SEQ ID N° 2. 

22. Promoteur d'un gene de phytase de plante selon la revendication 18, 
caracterise en ce qu'il contient tout ou partie du fragment allant du nucleotide n° 1 au 
nucleotide n° 1328 de la sequence telle que definie dans SEQ ID N° 3. 
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5 23. Promoteur d'un gene de phytase de plante caracterise en ce qu'il comprend 
une sequence identique ou homologue a plus de 70 % de la sequence du promoteur tel 
que defini dans la revendication 19 ou 20. 

24. Promoteur d'un gene de phytase de plante caracterise en ce qu'il comprend 
10 tout ou partie d'une sequence complementaire ou complementaire de Phomologue 

d'une sequence telle que definie dans la revendication 23. 

25. Utilisation d'un promoteur selon 1'une des revendications 18 a 24 dans des 
constructions moleculaires destinees a ameliorer la qualite agronomique alimentaire ou 

15 industrielle d'une plante, notamment la resistance aux pathogenes ou la disponibilite 
en nutriments. 

26. Cassette d'expression caracterisee en ce qu'elle comporte un fragment 
d'ADN selon Tune des revendications 6 a 17, place sous le controle de sequences 

20 regulatrices capables de commander 1'expression de ladite phytase. 

27. Cassette d'expression, caracterisee en ce qu'elle comporte un promoteur tel 
que defini dans l'une des revendications 18 a 24. 

25 28. Cassette d'expression selon la revendication 26, caracterisee ence que 

lesdites sequences regulatrices sont capables de commander 1'expression 
specifiquement dans un type particulier de tissu. 

29. Procede pour accroitre la teneur en phytase d'une plante, caracterise en ce 
30 qu'on transforme ladite plante avec un vecteur comportant une cassette d'expression 

selon l'une des revendications 26 a 28 dans laquelle lesdites sequences regulatrices 
sont capables de commander 1'expression de ladite phytase dans ladite plante. 

30. Hote vegetal consistant en une plante ou organe vegetale, notamment 
35 transgenique, contenant une quantite accrue de phytase, caracterise en ce que l'hote 

vegetal a ete transforme avec une cassette d'expression selon l'une des 
revendications 26 a 28. 

31. Plante transgenique selon la revendication 30, caracterisee en ce qu'elle 
40 produit des semences transgeniques exprimant une quantite accrue de phytases. 
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32. Hote vegetal consistant en une plante ou organe vegetal transgenique dans 
lequel la phytase de plante est exprimee dans une partie de la plante ou un 
compartiment cellulaire ou cette enzyme n'est pas produite naturellement, 
caracterise en ce qu'on a introduit une cassette d'expression selon la revendication 
26 comportant des sequences regulatrices qui induisent une expression specifique 
dans ladite partie de la plante ou ledit compartiment cellulaire. 

33. Plante ou organe vegetal selon Tune des revendications 30 a 32, caracterisee 
en ce qu'il s'agit de cereales. 

34. Plante ou organe vegetal selon la revendication 33, caracterisee en ce qu'il 
s'agit de mai's. 

35. Semences seches de plante selon Tune des revendications 30 a 34. 

36. Semences selon la revendication 35, caracterisees en ce qu'elles component 
une teneur globalement ou localement accrue en phytase obtenue par une 
expression specifique dans la semence de la sequence d'ADN selon Tune des 
revendications 1 a 4 ou du fragment decide nucleique selon Tune des 
revendications 6 a 17. 

37. Farine de semences obtenue a partir d'une semence selon Tune des 
revendications 35 et 36. 

38. Methode de production de phytase, caracterisee en ce qu'elle comprend les 
etapes de : 

a) transformation d'un hote eucaryote ou procaryote, en particulier d'un 
vegetal ou d'un microorganisme avec une cassette depression selon 
la revendication 26, comportant des sequences regulatrices capables de 
commander Pexpression d'une quantite accrue de phytase dans l'hote 
vegetal ou le microorganisme respectivement ; 

b) culture du microorganisme transforme ou croissance de la plante 
transformee ; et 

c) extraction de la phytase de la culture de microorganismes ou des tissus 
vegetaux transgeniques. 



5 
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39. Phytase recombinante obtenue par le procede de la revendication 38. 

40. Phytase selon la revendication 39, caracterisee en ce qu'elle est un dimere 
ou un heterodimere. 

41. Anticorps diriges contre la phytase de la plante selon la revendication 39. 



42. Composition pour Palimentation humaine ou animale comprenant tout ou 
partie de plante selon Tune des revendications 30 a 36 ou une farine de semence 

15 selon la revendication 37. 

43. Composition pour Palimentation humaine ou animale comprenant une 
phytase de plante selon la revendication 39. 

20 44. Composition pour Palimentation humaine ou animale selon la revendication 
42 ou 43, caracterisee en ce que la plante est choisie parmi le ble, Porge, le sorgho, 
le mais, le pois, le soja et la pomme de terre. 



45. Utilisation d'un fragment selon Pune des revendications 6 a 17 comme 
25 marqueur d'un phenotype lie a Pexpression de la phytase. 

46. Utilisation d'une phytase selon la revendication 39, pour Pextraction 
d'amidon a partir de grains de plantes et/ou pour la valorisation des eaux de 
trempage ou de brassage. 

30 

47. Utilisation de tout ou partie de plante selon Pune des revendications 30 a 36, 
pour Pextraction d'amidon a partir de grains de plantes et/ou pour la valorisation 
des eaux de trempage ou de brassage. 
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80 

* 

aagctttctg aaaaagtcca atcactaaaa ttgagttcag agtaaaaact tatggcatct ttcgtgaagc tggttgtgca 

160 

gcggcaatgc gacacggatg agcggcagca tagggcctgt atagccccaa acagctagtt ttaaccccaa cgactagttt 

240 

tggttggggt tatatttaca catcccacgc cctggggtcc tgctggtgtc tagaatagtt caaactcatc ccaaaccata 

320 

tttaagccct ctctaattcc tctatttatg ggagcgtgtg actagtgttt gattacggtt aaagaactga ttaagagcta 

400 

gagagcagat ctagagcaag acaaccttga gcacttgtca ggcttcgtca acattcattg cacactcatt actcttggag 

480 

gggaagcctc ctcaacggct aggcgtcccc cggtgatctc ccatgcttgt tgtgaaccgc aggaaagtct gtaattaccc 

560 

catatcttag tgaaaaaacc agctcagtat tttggtggtg agttgaaaca gactcctttt agcttcctca acaacatgga 

640 

cttagacata gcctgacaca ctcttatttt ggatatctct actcctttaa agcaccagct tcttgtgtcg tgtgtcacgt 

720 

gcgaaacttg ttagtctgtt gctctccctt gcatcttgcc tgaccatgga cccaataggt tgttatacca tagataggcc 

800 

atgatagact acccaacgag ctcaacccga taggaagcca cacacaacgc aacactctca catagtacca cctcgctagc 

880 

ggaagggaac gagcgatcga gcgagctata aaaatgttca gtctgtttgt catgcctggc gtggccataa ttattcttag 

960 

ggtatgttag attactttag tctcggtatt aaagtttagt cattactctg tttggmca gagattaaaa atgttcataa 

1040 

ctcactaaaa aatttgttag aagaccaaaa tattctttat cattctctcg ccactactct tctcccgcg3 caacggaaat 

1 120 

aaataagggg caaccatgaa attgacatgt tttaggggtt gtttgaatgc actagagcta atagttagtc agctaaaaat 

FIGURE 4 
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1200 

atactagtag aattagctaa ctaacaaata gttagctaac gagtagctaa tttactaaaa atagttaata gctaaactat 

1280 
★ 

atattagcta tagggtgttt ggatgtctct agctaatttt agctaactat tatctctagt gcattcaaat aaccccttaa 

1360 
★ 

tcccatttag tcactcgagg aactactatt tccggtgtct tattatttat cgttttggac aaggtttgag taaaacttat 

1440 
* 

aaatttttta ctataaataa ctattttgat attagtttga aaacctaata cttatatgca taggtttgtc ttaaaaagta 

1520 

cttttataaa agtataaatg taataagagt ttatttgtat tttaggaaaa aacatcggtc aaagctatat atattttgga 

1600 

gactatatcg ttgtcctaaa cgacaataaa aaggcaccga gagagtaggg actaaagcgg tttaatctat cctttactgt 

1680 

tattgtttga taatttatgg attaatgaga ctaaaattct atgactaatc tttagtcccc aaactaaaca aacccttagt 

1760 

atgattgatc ctggacagca tacagaccca tgcttaactt gatacaacac caacaagacc agaccccacc cccucccta 

1840 

tcaacggagg gatgatatat tatttaagtg catgcgcgtg ctgcacgctg uatggacct atttggtagg actaggagta 

1920 

ggatatatat cacaaagttg tatacctata aatagctcgc tttgatcata tgatctgctg ccttatacga aacatagcta 

2000 

ctcctactac tcaaATCCAT CCTTATTgta agtgcggtct tataagctac tactagttac aagctggttt atacttaact 

2080 

acaagtagca acgatttgcc ttagtatata tggttcataa tacataaata ttggaactga gacaatatat atatgcagGA 

2147 

CCTTAGTGTT TCATCC ATG GAC TCG GAA GGA GTA CCA GCA AAG GTG CCA GA7 GAG ACT ACT AAA CCG 

Met Asp Ser Glu Gly Val Ala Ala Lys Val Ala Asp Glu Thr Thr Lys Pro 
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2213 
* 

GCA AGC CAA GAA GAC GGC GAG AGC A AG GCC GGG ATG ACT GAT CTG CTG ATG CTG ACC GAC AAG TCG 

Ala Ser Gin Glu Asp Gly Glu Ser Lys Ala Gly Met Thr Asp Leu Leu Met Leu Thr Asp Lys Ser 

2279 

CAG CTG CAG GCG CTA GCG ATG CTG CTG CGG AAC AAC GAC GAG CTC ATG ATG AGC CAA GCG ATC AAG 

Gin Leu Gin Ala Leu Ala Met Leu Leu Arg Asn Asn Glu Glu Leu Met Met Ser Gin Ala lie Lys 

2345 

TCG GAG ACG GAG CGC GTT GAG TAC CTC AAG ACG GTG AGC GAC TGC TAC ACG CGG ACA ATG AAG CTC 

Ser Glu Thr Glu Arg Val Glu Tyr Leu Lys Thr Val Ser Asp Cys Tyr Thr Arg Thr Met Lys Leu 

241 1 
★ 

CTT GAC GAC TCC ATG GCG GCC AGG ATC ACG TAC GAG CGT TCG GGC GGA ACG ACG AGC CTC GTC GCC 

Leu Asp Asp Ser Met Ala Ala Arg He Thr Tyr Glu Arg Ser Gly Gly Thr Arg Ser Leu Val Ala 

2477 

CGG GAC ATG GAC GAC TAC GTC GTC TAC GGC CTC AAC GCG TGC TTG CAG AAC GTC CGC AAC TGC TGC 

Arg Asp Met Asp Asp Tyr Val Val Tyr Gly Leu Asn Ala Cys Leu Gin Asn Val Arg Asn Cys Cys 

2543 

GTG CGT CTG GAC GCC ATC GAC AAG CTG CGG GCG CAC TAC GAC GCC CTC GCC GAC GCC GTC GCC GAA 

Val Arg Leu Asp Ala He Asp Lys Leu Arg Ala His Tyr Asp Ala Leu Ala Asp Ala Val Ala Glu 

2609 

CCG GCC GCC AAC GTC GAG GGC CTC GCC GCG GAG GCG TCC GAG TAC AAG GCC GCC ATG TCG CAG TAC 

Pro Ala Ala Asn Val Glu Gly Leu Ala Ala Glu Ala Ser Glu Tyr Lys Ala Ala Met Trp Gin Tyr 

2675 

TGC TAC AAC CAG CGG AGC GCC TCC GCG CGG GCG CAC TCC CGC GCC TAC TCC CAG GCG CTC AAG CTG 

Cys Tyr Asn Gin Arg Ser Ala Ser Ala Arg Ala His Ser Arg Ala Tyr Ser Gin Ala Leu Lys Leu 

2741 
* 

GAG GGC ATC GAC TTC GCC GAG CTT GTG CGG AGG CAC CAG CTC CGG CTC CGG TAC GGC AGC AAG GGC 

Glu Gly lie Asp Phe Ala Glu Leu Val Arg Arg His Gin Leu Arg Leu Gly Tyr Gly Ser Lys Gly 

2807 

GAG GAC CTG GAC GAC ACC CAG AAG CTG GAG GTG TAC AAC AGC ATC ATC GTC GAG TCG 

Glu Asp Leu Asp Asp Thr Gin Lys Leu Glu Val Tyr Asn Ser lie lie Val Glu Ser 

2873 
•» 

GGG CGG GCG GGG CTA CCG GTG CGG ATG TTC TCG TCG GGC CGC 7CT GCC GGT GGC CCT AAG ATT GCA 

Gly Arg Ala Gly Leu Pro Val Arg Met Phe Ser Ser Gly Arg Ser Ala Gly Gly Pro Lys lie Ala 

2939 

GCC ACG ACG TGG GCG CAG GCG GTG AGC GTC TTC ATC ATG GCG GCG GGC AAC CTG GCG TGG GAC CTG 

Ala Thr Thr Trp Ala Gin Ala Val Ser Val Phe lie Met Ala Ala Gly Asn Leu Ala Trp Asp Val 



GAG GAG TTC 

Glu Glu Phe 
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3005 

TTC ACC ACG GAG CAC GAG GTG GAG GCC ATC CTC AAG GGC AGC CTC AAC CTC CTG GCG GGG CTA GGG 

Phe Thr Thr GIu His G!u Val Glu Ala He Leu Lys G!y Ser Leu Asn Leu Leu Ala Gly Leu Gly 

3071 

GGC TTC GCC GTG GAG GCC GTC GTC GGC GCG GCT GTC ACC AAG GCG GTC GCA AAC GTC GGC GCC GGC 

Gly Phe Ala Val Glu Ala Val Val Gly Ala Ala Val Thr Lys Ala Val Ala Asn Val Gly Ala Gly 

3137 

GTC TTT GCT TGC TCT CTC GCG GGC TTC GTC GTG GGC GCC ATA GCC GGG CTG ATC TTC ATC GGC GTC 

Val Phe Ala Cys Ser Leu Ala Gly Phe Val Val Gly Ala He Ala Gly Leu lie Phe He Gly Val 

3203 
★ 

AGC GGC CTC CTC ATT AAC CTC ATC ATC GGC TCC CCT ACG AAG GTG CCT CAC ATG AGC AAG CTC ATC 

Ser Gly Leu Leu He Asn Leu He He Gly Ser Pro Arg Lys Val Pro Asp Met Ser Lys Leu Met 

3270 

TTC CAC ACC GCC GTC ATG CCC CAT GGA ATG GCC CTT GCG TAT GCG GTA TCT CAT TAA TTACTTATTA 

Phe His Thr Ala Val Met Pro Asp Gly Met Ala Leu Ala Tyr Ala Val Ser His 

3350 
* 

TCATCGCAGT GACTACCGAT GCAACTGCTT CAGATCCTAC TGTTGGAACG CGTGTGGAAA TAATAAAGGA ATAATAATAA 

3430 

ttattattgt aataacaata attatcatat attgataatg attatatatc AAAtagcttc tctcgattcg tcgtgacaca 

3510 

cgtcacatga gtccatggtg tgccccgctt cgcacgaccc acgaccggac agacaattrt agctgagtgt taaatttttg 

3590 

tctcgagtac aaatccacgg ggcaaagaaa ggccatcgag caaatcgaac atttatttag tgtcagacac tcggtaaaga 

3670 

aatcaaattt ttggtgtgaa cacttaacaa agaaaaacaa tcagtaaaaa ggtggtttaa ctaatatcgg atacttatca 

3750 

aataaaaatg ctcgacaaaa agtggtttgg ctagtgtcac catcagcaac taataccacc taaccaccat tctttttgcc 

3830 

gagtgtccta ccgcgtcact cgtcaaagga ggcctctttg tuggcacca ucctagact ctagttaaat aggtatttgc 

3910 

ctagcgtcag ctcagaatag gaggcaaaga tgcactttgt gtattattat cttcttttac acccaacaaa gtatttttta 
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3990 

tttttttctt cttgccctaa aacttgttct gctatattcc tataacacct agaactacat gttcagtttt ggtacatttc 

4070 

tcagtgtttt gtagatttag taaatttatt ttatttaact gaatttcttg agataattca aatttgaacg gtaagtcatt 

4150 

cgtataatga aaacatgaat agaaaacaga tgttcatgtt actaagtata agttgaggtc gtatacaata atagaccaga 

4230 

aaattcgaac attatgttca cgaaatatca ccatgtacaa ttgtttttaa attgtataaa aagcaaacga agtttgaaaa 

4310 

attataaaac tttcgggatg tcatgatatc ataagtggag gctataataa aaggttgata aagtttcatt aaagtttgac 

4390 

atgtactatg gttaccacct aatcaatctc catatgaaac aaatcatgaa acatattcgt cgattcttcg gtttgtaaac 

4470 

attcatgaaa tcatgtcaac tttttatcac agcctccaca tataaactat catgattttc taactttgtt tgctttttat 

4550 

ataatttaaa aacggttttt tggacactag gcaaagagct tctttgccaa gtgttttttg gactcttggc aaagacaata 

4630 

gttggaaact ttttgatttg aagacatctt gtcaatgaaa actatgtctg aattttttta aaaatgtaat tcaaaatttt 

4695 

caaatgacct cgaatgaaaa aatcaccaaa ataatagttg tagatccgtt gacctgcagg tcgac 
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80 

aagcttaaag atcccattgg aagttaaact ctcggaaaga gttgatcgga tgttagacta acttctgacg gtcgttgggg 

160 

cccatcggaa gttagcgacg taaacgttgt tagcaccgaa acttctaacc attttagtgg cctctcggaa gttattgtgc 

240 

taacttccaa ggggtcccac cggcttctca aaagttaatg tgctaacttc aggccatut agtggcctct cgaaatttat 

320 

attgaaccaa cattcaaaat gttatttatt ttccaatttc actatatttc aatacatcgg gataccaacc atccggaaaa 

400 

caacactaac tgcaatagca tctcatctgt ttcatcacaa taacaccaca cctcataaat ctcatcaatt aaacacaatt 

480 
★ 

ccaatatatt tcttcaaaat aagaactcaa ttagtctcat ctcaacccaa gacacatccc aaatgtctta cagggttcac 

560 

aagttcacct cccatctatt tgaactatat cttatatatt aacaaacaac attagtttaa atatcataca tttagttatg 

640 

tctctttcct catttttact cgtagccatg atttttgttt agttttgcct cttctgctct tcagcaacag aataacaaaa 

720 

ctgagtagaa aatacaacta agggtaaaaa taaggaaagc ggtagaacta acggcaccac ttcaaaatgt cgtagtttaa 

800 

ataatttgat gttcatcaaa tactaaaatt caaaattaaa gacctctaga gtatatttu cttacaagct ccagtggtgg 

880 

ccgtgcctcg cgtggccata atcatcctta gtatgattga tcatggacag ggtacagacc catgcttgac txgataaaac 

960 

accaacaata ccagacccca tccccttccc tatcaacaac ggagggacga tgatataua maggtctt gttcggatac 

1040 

tctactatta tattcactct aaatcatatg tgttaatact agagtaccta aacaaggcct taagtgcatg cacgtgctgc 

FIGURE 5 



WO 98/05785 AA , AA PCT/FR97/01443 

1 1/14 

1120 
+ 

acgctgttat ggacctatta ggtagtagta ggtcgagtag gatatatatc acaaagttgt atacctacaa atagctcgct 

1200 

ttgataacat gatctgctgc cttatacgaa acatagctac ctactactca agtatccatc CTTATTgtaa gtgctcttat 

1280 

aagctactac tagttacaag ctggtttata tttaactaca agtagcaacg atttgtctta gtatatatgg ttcataatac 

1355 
* 

atatatattg gaactgagat aatatatgca g gagtacagt gttgatcc atg gac tcg gaa gga gtt gta gca gca 

Met Asp Ser Glu Gly Val Val Ala Ala 

1421 

AAG GTG GCA GAT GAG ACT ACT AAA CCG GCA ATC CAA GAA GAC GGC GCC GAG AGC AAG GCC GGG ATG 

Lys Val Ala Asp Glu Thr Thr Lys Pro Ala lie Gin Glu Asp Gly Ala Glu Ser Lys Ala Gly Met 

1487 

ACT GAT CTG CTG ATG CTG ACC GAC AAG TCG CAG CTG CAG GCG CTG GCG ATG CTG CTG CGG AAC AAC 

Thr Asp Leu Leu Met Leu Thr Asp Lys Ser Gin Leu Gin Ala Leu Ala Met Leu Leu Arg Asn Asn 

1553 
* 

GAG GAG CTC ATG ATG AGC CAG GCG ATC AAG TCG GAG ACG GAG CCC ATT GAG TAC CTC AAG ACG GTG 

Glu Glu Leu Met Met Ser Gin Ala lie Lys Ser Glu Thr Glu Arg lie Glu Tyr Leu Lys Thr Val 

1619 
* 

AGC GAC TGC TAC ACG CGG ACG ATG AAG CTC CTC GAC GAT TCC ATG GCG GCC AGG ACC ACG TAC GAG 

Ser Asp Cys Tyr Thr Arg Thr Met Lys Leu Leu Asp Asp Ser Met Ala Ala Arg Thr Thr Tyr Glu 

1685 

CGT TCG GGC GGA ACG AGG AGC CTC GTC GCC CGG GAC ATG GAC GAC TAC GTC GTC TAC GGC CTC AAC 

Arg Ser Gly Gly Thr Arg Ser Leu Val Ala Arg Asp Met Asp Asp Tyr Val Val Tyr Gly Leu Asn 

1751 

GCG TGC TTG CAG AAC GTC CGC AAC TGC TGC GTG CGC CTG GAC GCC ATC GAC AAG CTG CGG GCG CAC 

Ala Cys Leu Gin Asn Val Arg Asn Cys Cys Val Arg Leu Asp Ala lie Asp Lys Leu Arg Ala His 

1818 

TAC GAC GCC CTC GCC GAC GCC GTC CCC GAC CCG GCC CCC AAC GTC GAG CGC CTC GCC CCG GAG GCG 
Tyr Asp Ala Leu Ala Asp Ala Val Ala Asp Pro Ala Ala Asn Val Glu Gly Leu Ala Ala Glu Ala 
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1883 

TCC GAG TAC AAG GCC GCC ATG TGG CAG TAC TGC TAG AAC CAG CGG AGC GCC TCC GCG CGG GCG CAC 

Ser Glu Tyr Lys Ala Ala Met Trp Gin Tyr Cys Tyr Asn Gin Arg Ser Ala Ser Ala Arg Ala His 

1949 

TCC CGC GCC TAC TCC CAG GCG CTC AAG CTG GAG CGC ATC CAC TTC GCC GAG CTG CTG CGG AGG CAC 

Ser Arg Ala Tyr Ser Gin Ala Leu Lys Leu Glu Gly lie Asp Phe Ala Giu Leu Val Arg Arg His 

2015 

CAG CTC CGG CTC GGG TAC GGC AGC AAG GGC GAG GAG TTC GAG CAC CTG CAC GAC ACC CAC AAG CTG 

Gin Leu Arg Leu Gly Tyr Gly Ser Lys Gly Glu Glu Phe Glu Asp Leu Asp Asp Thr Gin Lys Leu 

2081 

CAG GTG TAC AAC AGC ATC ATC GTC GAG TCG GGG CGG GCG GGG CTA CCG GTG CGG ATG TTC TCG TCG 

Glu Val Tyr Asn Ser He lie Val Glu Ser Gly Arg Ala Gly Leu Pro Va! Arg Met Phe Ser Ser 

2147 

GGC CGC TCT GCC GGT GGC CCT AAG ATT CCA GCC ACG ACG TGG GCG GAG GCC GTG ACC GTC TTC ATC 

Gly Arg Ser Ala Gly Gly Pro Lys He Ala Ala Thr Thr Trp Ala Glu Ala Val Ser Val Phe lie 

2213 
* 

ATG GCG GCG GGC AAC CTG GCG TGG GAC GTG TTC ACC ACG GAG CAC GAG GTG GAG GCC ATC CTC AAG 

Met Ala Ala Gly Asn Leu Ala Trp Asp Val Phe Thr Thr Glu His Glu Val Glu Ala lie Leu Lys 

2279 

GGC AGC CTC AAC CTC CTG GCG GGG CTA GGG GGC TTC GCC GTG GAG GCC CTC GTC GGC GCG GCT GTC 

Gly Ser Leu Asn Leu Leu Ala Gly Leu Gly Gly Phe Ala Val Glu Ala Val Val Gly Ala Ala Val 

2345 

ACC AAG GCG GTC GCA AAC. GTC GCC GCC GGC GTC TTT GCT TGC TCT CTC GCC GGC TTC GTC GTG GGC 

Thr Lys Ala Val Aal Asn Val Gly Ala Gly Val Phe Ala Cys Ser Leu Ala Gly Phe Val Val Gly 

241 1 

GCC ATC GCC GGG CTG ATC TTC GTC GGC GTC AGC GGC CTC CTC ATT AAC CTC ATC ATC GGC TCC CCA 

Ala He Ala Gly Leu He Phe Val Gly Val Ser Gly Leu Leu lie Asn Leu He lie Gly Ser Pro 

2477 

AGG AAG GTG CCT CAC ATG AGC AAG CTC ATG TTC CAC ACC GCC GTC ATG CCC GAT GCA ATG CCC CTT 

Arg Lys Val Pro Asp Met Ser Lys Leu Met Phe His Thr Ala Val Met Pro Asp Gly Met Ala Leu 

2550 

GCC TAT CCG GTA TCT CAT TAATT ACTTAATATC ATCGCAGTGA CTACCAATGC AACTCCTTCA CCTCCTACrG 

Ala Tyr Ala Val Ser His 
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2630 

★ 

TTGCAACGCG CGTGTGGAAA TAAGAAGGGA ATAATAATAA TTATTATTAT TGTAATAAAA AATAATTATC ATATATTGAT 

2710 
* 

AATGATTATA TATCAAATat cttttctcga ttcgtcgtga cacacgtcac atgagtccat ggtgcacgcc ttcgctcgac 

2790 

ccacgaccag acaattttag ctgacgtccc gtttagactc attagaattg aattccattc taataatagt aatttaggca 

2870 

tatattaact aagataattc gattttatac aaaatatatt ggtatattat tattagtaag atgtcgaaga tatttatgtg 

2950 

ctacattttt actatagagg agtgagacga aaagtgtcat gtaagttata tagaagaaac aaattctact catgcataaa 

2991 

atcatttctc atcccccacc ccatgaattt gagataagct t 
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cDNA ?hy Sll 
Classe I 
Classe II 



md s eg v - aaxvadett k ? a sq edg - e s xagmt dl li-£lt dx3 q lq al aml l 
mdsegv-^<vadettk?asqedg-esk.^gmtdlucltd:<sqlqala>cll 

MD S EG WAAKV AD ETT K PA I Q EDG AE S XAG MT DL LMLT D KSQLQAL AML L 



cDNA phy Sll 
Classe I 
Classe II 



RNNEELMMSQAIKSETERVEYLKTVSDCYTRT^<LLDDS^\AHITYERSG 
RNNEEL^ISQAIKSETERVEYLKTVSDCYTRT^<LLDDSJ-LAAKITYERSG 
RNNEELM^^SQAIKSETERIEYLKTVSDCYTRT^C<LLDDS^L\ARTTYERSG 



cDNA phy Sll GTRSLVARDMDDYVVYGLNACLQ^A/^lNCCVllLDAIDKLRAHYDALADAVA 
Classe I GTRSLVARDMDDYVVYGLNACLQNVRNCCVRLDAIDKLRAHYDALADAVA 
Classe II GTR S L V ARDMDD YWYG LN ACLQNVRNCC VRL DA I D KL RAH Y D AL AD A V A 



cDNA phy Sll 
Classe I 
Classe II 



EPAANVEGLAAEASEYKAAMWQYCYNQRSASARAHSRAYSQALKLEGIDF 
EPAANVEGLAAEASEYKAAMWQYCYNQRSASARAHSRAYSQALKLEGIDr 
DPAANVEGLAAEASEYKAAMWQYCYNQRSASA-RAHSRAYSQALKLEGIDF 



cDNA ohy Sll AELVRRHQLRLGYGSKGEEFEDLDDTQKLEVYNS I IVESGRAGLPVARMFS 

Classe I AELVRRHQLRLGYGSKGEEFEDLDDTQKLEVYNSIIVESGRAGLPVRMFS 
Classe II AELVRRHQLRLGYGSKGEEFEDLDDTQKLEVYNSIIVESCRACLPVRMFS 



cDNA phy Sll 
Classe I 
Classe II 



SGRSAGGPKIAATTWAQAVSVyiMAAGNLAWDVTTTEHEVEAILKGSLiVL 
SGRSAGGPKIAATTWAQAVSVFIMAAGNLAl^^^VFTTEHEVEAILKGSL^fL 
SGRSAGGPKIAATTWAEAVSVFIMAAGNLAWDVTFTTEHEVEAILKGSLNI* 



cDNA Ohy Sll LAGLGGr AVEAWGAAVTKAVANVAAGVFACSLAGFWGAIAGLIFVGVS 

Classe I LAG LGG F AVEA WG AAVTKAVANVG AG VF AC S LACFWG A I AG L I F IG VS 

Classe II LAGLGGFAVEAWGAAVTKAVANVGAGVFACSLAGrWGAIAGLIFVGVS 



CDNA phy Sll CLLINLIIGSPRKVPDMSKLMFHTAVMPDGMALAYAVSH 
Classe I GLLIt>TLIIGSPR:<VPDMSKLMFHTAVM?OG>UL.\YAVSH 
Classe II GLLINLIIGSPRKVPDMSKLMFHTAVMPDGMALAYAVSH 
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